105
SÉMINAIRE DELICORTAL Sommes-nous sortis du bois ou de l’auberge ? Dépistage semi-automatique de la variation diatopique en langue spécialisée 25 octobre 2016 Patrick Drouin Observatoire de linguistique Sens-Texte (OLST) Université de Montréal

Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

  • Upload
    lekhanh

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

SÉMINAIRE DELICORTAL

Sommes-nous sortis du bois ou de l’auberge ?Dépistage semi-automatique de la variation diatopiqueen langue spécialisée

25 octobre 2016

Patrick DrouinObservatoire de linguistique Sens-Texte (OLST)Université de Montréal

Page 2: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

PLAN

Page 3: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

PLAN

1. Plan

2. Qui suis-je ?

3. Variation terminologique

4. Problématique

5. Étude

6. Méthodologie

7. Résultats

8. Conclusion3

Page 4: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

QUI SUIS-JE ?

Page 5: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

QUI SUIS-JE ?

Enseignement

# Terminologie

# Localisation# Traduction et terminologie assistée par ordinateur

RechercheDirecteur de l'Observatoire de linguistique Sens-Texte depuis 2015.

# Terminologie# Traitement automatique de la langue# Linguistique de corpus

5

Page 6: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

QUI SUIS-JE ?

Enseignement

# Terminologie# Localisation

# Traduction et terminologie assistée par ordinateur

RechercheDirecteur de l'Observatoire de linguistique Sens-Texte depuis 2015.

# Terminologie# Traitement automatique de la langue# Linguistique de corpus

5

Page 7: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

QUI SUIS-JE ?

Enseignement

# Terminologie# Localisation# Traduction et terminologie assistée par ordinateur

RechercheDirecteur de l'Observatoire de linguistique Sens-Texte depuis 2015.

# Terminologie# Traitement automatique de la langue# Linguistique de corpus

5

Page 8: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

QUI SUIS-JE ?

Enseignement

# Terminologie# Localisation# Traduction et terminologie assistée par ordinateur

RechercheDirecteur de l'Observatoire de linguistique Sens-Texte depuis 2015.

# Terminologie

# Traitement automatique de la langue# Linguistique de corpus

5

Page 9: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

QUI SUIS-JE ?

Enseignement

# Terminologie# Localisation# Traduction et terminologie assistée par ordinateur

RechercheDirecteur de l'Observatoire de linguistique Sens-Texte depuis 2015.

# Terminologie# Traitement automatique de la langue

# Linguistique de corpus

5

Page 10: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

QUI SUIS-JE ?

Enseignement

# Terminologie# Localisation# Traduction et terminologie assistée par ordinateur

RechercheDirecteur de l'Observatoire de linguistique Sens-Texte depuis 2015.

# Terminologie# Traitement automatique de la langue# Linguistique de corpus

5

Page 11: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

OBSERVATOIRE DE LINGUISTIQUE SENS-TEXTE (OLST)

ObservatoiredelinguistiqueSens-Texte(OLST)

# Groupe de recherche multidisciplinaire

# Fondé en 1997 par Igor Mel’čuk# Liens bien établis entre l'OLST et le LIDILEM

Axesderecherche

# I Axe lexicologie et lexicographie# II Axe terminographie# III Axe traitement de corpus# IV Axe didactique des langues# V Axe applications documentaires

6

Page 12: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

OBSERVATOIRE DE LINGUISTIQUE SENS-TEXTE (OLST)

ObservatoiredelinguistiqueSens-Texte(OLST)

# Groupe de recherche multidisciplinaire# Fondé en 1997 par Igor Mel’čuk

# Liens bien établis entre l'OLST et le LIDILEM

Axesderecherche

# I Axe lexicologie et lexicographie# II Axe terminographie# III Axe traitement de corpus# IV Axe didactique des langues# V Axe applications documentaires

6

Page 13: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

OBSERVATOIRE DE LINGUISTIQUE SENS-TEXTE (OLST)

ObservatoiredelinguistiqueSens-Texte(OLST)

# Groupe de recherche multidisciplinaire# Fondé en 1997 par Igor Mel’čuk# Liens bien établis entre l'OLST et le LIDILEM

Axesderecherche

# I Axe lexicologie et lexicographie# II Axe terminographie# III Axe traitement de corpus# IV Axe didactique des langues# V Axe applications documentaires

6

Page 14: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

OBSERVATOIRE DE LINGUISTIQUE SENS-TEXTE (OLST)

ObservatoiredelinguistiqueSens-Texte(OLST)

# Groupe de recherche multidisciplinaire# Fondé en 1997 par Igor Mel’čuk# Liens bien établis entre l'OLST et le LIDILEM

Axesderecherche

# I Axe lexicologie et lexicographie

# II Axe terminographie# III Axe traitement de corpus# IV Axe didactique des langues# V Axe applications documentaires

6

Page 15: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

OBSERVATOIRE DE LINGUISTIQUE SENS-TEXTE (OLST)

ObservatoiredelinguistiqueSens-Texte(OLST)

# Groupe de recherche multidisciplinaire# Fondé en 1997 par Igor Mel’čuk# Liens bien établis entre l'OLST et le LIDILEM

Axesderecherche

# I Axe lexicologie et lexicographie# II Axe terminographie

# III Axe traitement de corpus# IV Axe didactique des langues# V Axe applications documentaires

6

Page 16: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

OBSERVATOIRE DE LINGUISTIQUE SENS-TEXTE (OLST)

ObservatoiredelinguistiqueSens-Texte(OLST)

# Groupe de recherche multidisciplinaire# Fondé en 1997 par Igor Mel’čuk# Liens bien établis entre l'OLST et le LIDILEM

Axesderecherche

# I Axe lexicologie et lexicographie# II Axe terminographie# III Axe traitement de corpus

# IV Axe didactique des langues# V Axe applications documentaires

6

Page 17: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

OBSERVATOIRE DE LINGUISTIQUE SENS-TEXTE (OLST)

ObservatoiredelinguistiqueSens-Texte(OLST)

# Groupe de recherche multidisciplinaire# Fondé en 1997 par Igor Mel’čuk# Liens bien établis entre l'OLST et le LIDILEM

Axesderecherche

# I Axe lexicologie et lexicographie# II Axe terminographie# III Axe traitement de corpus# IV Axe didactique des langues

# V Axe applications documentaires

6

Page 18: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

OBSERVATOIRE DE LINGUISTIQUE SENS-TEXTE (OLST)

ObservatoiredelinguistiqueSens-Texte(OLST)

# Groupe de recherche multidisciplinaire# Fondé en 1997 par Igor Mel’čuk# Liens bien établis entre l'OLST et le LIDILEM

Axesderecherche

# I Axe lexicologie et lexicographie# II Axe terminographie# III Axe traitement de corpus# IV Axe didactique des langues# V Axe applications documentaires

6

Page 19: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

OBSERVATOIRE DE LINGUISTIQUE SENS-TEXTE (OLST)

Linguistiqueettraduction

# Lidjia Iordanskaja (Université de Montréal)# Anna Joan Casademont (TÉLUQ)# *Aline Francoeur (Université Laval)# FrançoisLareau(UniversitédeMontréal)# Marie-ClaudeL’Homme(UniversitédeMontréal)# Sébastien Marengo (Université de Sherbrooke)# Elizabeth Marshman (Université d'Ottawa)# Igor Mel’čuk (Université de Montréal)# Jasmina Milićević (Dalhousie University)# *Aurélie Picton (Université de Genève)# Janine Pimentel (Universidade Federal do Rio de Janeiro)# *Alain Polguère (ATILF, CNRS, Université de Lorraine)

7

Page 20: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

OBSERVATOIRE DE LINGUISTIQUE SENS-TEXTE (OLST)

Didactique

# Dominic Anctil (Université de Montréal)# Pascale Lefrançois (Université de Montréal)# Ophélie Tremblay (UQAM)

Sciencesdel'information

# Lyne Da Sylva (Sciences de l'information, Université de Montréal)# Dominic Forest (Sciences de l'information, Université de Montréal)

8

Page 21: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

OBSERVATOIRE DE LINGUISTIQUE SENS-TEXTE (OLST)

Didactique

# Dominic Anctil (Université de Montréal)# Pascale Lefrançois (Université de Montréal)# Ophélie Tremblay (UQAM)

Sciencesdel'information

# Lyne Da Sylva (Sciences de l'information, Université de Montréal)# Dominic Forest (Sciences de l'information, Université de Montréal)

8

Page 22: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

VARIATION TERMINOLOGIQUE

Page 23: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

VARIATION TERMINOLOGIQUE

Pourquoi ?

# Travaux de Wüster (1931)

# Intérêt récent pour la variation en terminologie# Mise en évidence lente, mais inévitable des faiblesses du postulat

de base de Wüster# Approche aménagiste et la socioterminologie (variation

diatopique/régionale, diastratique/sociale, diaphasique/stylistique)# Traitement automatique de la langue (variation textuelle)# Évolution accélérée des connaissances (variation diachronique)# Disponibilité de corpus représentatifs de la variation

10

Page 24: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

VARIATION TERMINOLOGIQUE

Pourquoi ?

# Travaux de Wüster (1931)# Intérêt récent pour la variation en terminologie

# Mise en évidence lente, mais inévitable des faiblesses du postulatde base de Wüster

# Approche aménagiste et la socioterminologie (variationdiatopique/régionale, diastratique/sociale, diaphasique/stylistique)

# Traitement automatique de la langue (variation textuelle)# Évolution accélérée des connaissances (variation diachronique)# Disponibilité de corpus représentatifs de la variation

10

Page 25: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

VARIATION TERMINOLOGIQUE

Pourquoi ?

# Travaux de Wüster (1931)# Intérêt récent pour la variation en terminologie# Mise en évidence lente, mais inévitable des faiblesses du postulat

de base de Wüster

# Approche aménagiste et la socioterminologie (variationdiatopique/régionale, diastratique/sociale, diaphasique/stylistique)

# Traitement automatique de la langue (variation textuelle)# Évolution accélérée des connaissances (variation diachronique)# Disponibilité de corpus représentatifs de la variation

10

Page 26: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

VARIATION TERMINOLOGIQUE

Pourquoi ?

# Travaux de Wüster (1931)# Intérêt récent pour la variation en terminologie# Mise en évidence lente, mais inévitable des faiblesses du postulat

de base de Wüster# Approche aménagiste et la socioterminologie (variation

diatopique/régionale, diastratique/sociale, diaphasique/stylistique)

# Traitement automatique de la langue (variation textuelle)# Évolution accélérée des connaissances (variation diachronique)# Disponibilité de corpus représentatifs de la variation

10

Page 27: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

VARIATION TERMINOLOGIQUE

Pourquoi ?

# Travaux de Wüster (1931)# Intérêt récent pour la variation en terminologie# Mise en évidence lente, mais inévitable des faiblesses du postulat

de base de Wüster# Approche aménagiste et la socioterminologie (variation

diatopique/régionale, diastratique/sociale, diaphasique/stylistique)# Traitement automatique de la langue (variation textuelle)

# Évolution accélérée des connaissances (variation diachronique)# Disponibilité de corpus représentatifs de la variation

10

Page 28: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

VARIATION TERMINOLOGIQUE

Pourquoi ?

# Travaux de Wüster (1931)# Intérêt récent pour la variation en terminologie# Mise en évidence lente, mais inévitable des faiblesses du postulat

de base de Wüster# Approche aménagiste et la socioterminologie (variation

diatopique/régionale, diastratique/sociale, diaphasique/stylistique)# Traitement automatique de la langue (variation textuelle)# Évolution accélérée des connaissances (variation diachronique)

# Disponibilité de corpus représentatifs de la variation

10

Page 29: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

VARIATION TERMINOLOGIQUE

Pourquoi ?

# Travaux de Wüster (1931)# Intérêt récent pour la variation en terminologie# Mise en évidence lente, mais inévitable des faiblesses du postulat

de base de Wüster# Approche aménagiste et la socioterminologie (variation

diatopique/régionale, diastratique/sociale, diaphasique/stylistique)# Traitement automatique de la langue (variation textuelle)# Évolution accélérée des connaissances (variation diachronique)# Disponibilité de corpus représentatifs de la variation

10

Page 30: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

PROBLÉMATIQUE

Page 31: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

PROBLÉMATIQUE

Peut-onapprendredelalexicographie ?

# Variation bien prise en compte dans le cadre de la descriptionlexicographique

# Mécanismes de description sont relativement bien établis dans lesdictionnaires

# Dépistage de la variation, même dans cette tradition plusieurs foiscentenaire, laisse à désirer

# Lexicographe demeure le point fort de la démarche :connaissances et culture générale

# Le problème, c'est la mort.# Connaissances disparaissent avec le lexicographe...

12

Page 32: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

PROBLÉMATIQUE

Peut-onapprendredelalexicographie ?

# Variation bien prise en compte dans le cadre de la descriptionlexicographique

# Mécanismes de description sont relativement bien établis dans lesdictionnaires

# Dépistage de la variation, même dans cette tradition plusieurs foiscentenaire, laisse à désirer

# Lexicographe demeure le point fort de la démarche :connaissances et culture générale

# Le problème, c'est la mort.# Connaissances disparaissent avec le lexicographe...

12

Page 33: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

PROBLÉMATIQUE

Peut-onapprendredelalexicographie ?

# Variation bien prise en compte dans le cadre de la descriptionlexicographique

# Mécanismes de description sont relativement bien établis dans lesdictionnaires

# Dépistage de la variation, même dans cette tradition plusieurs foiscentenaire, laisse à désirer

# Lexicographe demeure le point fort de la démarche :connaissances et culture générale

# Le problème, c'est la mort.# Connaissances disparaissent avec le lexicographe...

12

Page 34: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

PROBLÉMATIQUE

Peut-onapprendredelalexicographie ?

# Variation bien prise en compte dans le cadre de la descriptionlexicographique

# Mécanismes de description sont relativement bien établis dans lesdictionnaires

# Dépistage de la variation, même dans cette tradition plusieurs foiscentenaire, laisse à désirer

# Lexicographe demeure le point fort de la démarche :connaissances et culture générale

# Le problème, c'est la mort.# Connaissances disparaissent avec le lexicographe...

12

Page 35: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

PROBLÉMATIQUE

Peut-onapprendredelalexicographie ?

# Variation bien prise en compte dans le cadre de la descriptionlexicographique

# Mécanismes de description sont relativement bien établis dans lesdictionnaires

# Dépistage de la variation, même dans cette tradition plusieurs foiscentenaire, laisse à désirer

# Lexicographe demeure le point fort de la démarche :connaissances et culture générale

# Le problème, c'est la mort.

# Connaissances disparaissent avec le lexicographe...

12

Page 36: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

PROBLÉMATIQUE

Peut-onapprendredelalexicographie ?

# Variation bien prise en compte dans le cadre de la descriptionlexicographique

# Mécanismes de description sont relativement bien établis dans lesdictionnaires

# Dépistage de la variation, même dans cette tradition plusieurs foiscentenaire, laisse à désirer

# Lexicographe demeure le point fort de la démarche :connaissances et culture générale

# Le problème, c'est la mort.# Connaissances disparaissent avec le lexicographe...

12

Page 37: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

PROBLÉMATIQUE

Dequoiest-ilquestionprécisément ?

# Principalement de ce qui est touché par les marques d'usage

# Exemples◦ pastèque, melon d'eau (liée au territoire)◦ mitaine, mouffle◦ céphalée, mal de tête (liée au niveau de langue)◦ maladie du coeur, maladie cardiaque (reformulation en discours)◦ écologie, sciences de l'environnement (liée à l'époque)

13

Page 38: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

PROBLÉMATIQUE

Dequoiest-ilquestionprécisément ?

# Principalement de ce qui est touché par les marques d'usage# Exemples

◦ pastèque, melon d'eau (liée au territoire)

◦ mitaine, mouffle◦ céphalée, mal de tête (liée au niveau de langue)◦ maladie du coeur, maladie cardiaque (reformulation en discours)◦ écologie, sciences de l'environnement (liée à l'époque)

13

Page 39: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

PROBLÉMATIQUE

Dequoiest-ilquestionprécisément ?

# Principalement de ce qui est touché par les marques d'usage# Exemples

◦ pastèque, melon d'eau (liée au territoire)◦ mitaine, mouffle

◦ céphalée, mal de tête (liée au niveau de langue)◦ maladie du coeur, maladie cardiaque (reformulation en discours)◦ écologie, sciences de l'environnement (liée à l'époque)

13

Page 40: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

PROBLÉMATIQUE

Dequoiest-ilquestionprécisément ?

# Principalement de ce qui est touché par les marques d'usage# Exemples

◦ pastèque, melon d'eau (liée au territoire)◦ mitaine, mouffle◦ céphalée, mal de tête (liée au niveau de langue)

◦ maladie du coeur, maladie cardiaque (reformulation en discours)◦ écologie, sciences de l'environnement (liée à l'époque)

13

Page 41: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

PROBLÉMATIQUE

Dequoiest-ilquestionprécisément ?

# Principalement de ce qui est touché par les marques d'usage# Exemples

◦ pastèque, melon d'eau (liée au territoire)◦ mitaine, mouffle◦ céphalée, mal de tête (liée au niveau de langue)◦ maladie du coeur, maladie cardiaque (reformulation en discours)

◦ écologie, sciences de l'environnement (liée à l'époque)

13

Page 42: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

PROBLÉMATIQUE

Dequoiest-ilquestionprécisément ?

# Principalement de ce qui est touché par les marques d'usage# Exemples

◦ pastèque, melon d'eau (liée au territoire)◦ mitaine, mouffle◦ céphalée, mal de tête (liée au niveau de langue)◦ maladie du coeur, maladie cardiaque (reformulation en discours)◦ écologie, sciences de l'environnement (liée à l'époque)

13

Page 43: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

ÉTUDE

Page 44: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

ÉTUDE

Hypothèses

# La variation, comme les termes, est observable en corpus

# L'humain n'est pas toujours à même de dépister le phénomène(connaissances, culture, immersion)

# La variation peut ou pourra être dégagée à l'aide d'outilsstatistiques

# Les outils et techniques déjà disponibles en TAL permettent deprendre en charge un premier dépistage

# Ce dépistage peut appuyer ou alimenter l'intuition du linguiste

15

Page 45: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

ÉTUDE

Hypothèses

# La variation, comme les termes, est observable en corpus# L'humain n'est pas toujours à même de dépister le phénomène

(connaissances, culture, immersion)

# La variation peut ou pourra être dégagée à l'aide d'outilsstatistiques

# Les outils et techniques déjà disponibles en TAL permettent deprendre en charge un premier dépistage

# Ce dépistage peut appuyer ou alimenter l'intuition du linguiste

15

Page 46: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

ÉTUDE

Hypothèses

# La variation, comme les termes, est observable en corpus# L'humain n'est pas toujours à même de dépister le phénomène

(connaissances, culture, immersion)# La variation peut ou pourra être dégagée à l'aide d'outils

statistiques

# Les outils et techniques déjà disponibles en TAL permettent deprendre en charge un premier dépistage

# Ce dépistage peut appuyer ou alimenter l'intuition du linguiste

15

Page 47: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

ÉTUDE

Hypothèses

# La variation, comme les termes, est observable en corpus# L'humain n'est pas toujours à même de dépister le phénomène

(connaissances, culture, immersion)# La variation peut ou pourra être dégagée à l'aide d'outils

statistiques# Les outils et techniques déjà disponibles en TAL permettent de

prendre en charge un premier dépistage

# Ce dépistage peut appuyer ou alimenter l'intuition du linguiste

15

Page 48: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

ÉTUDE

Hypothèses

# La variation, comme les termes, est observable en corpus# L'humain n'est pas toujours à même de dépister le phénomène

(connaissances, culture, immersion)# La variation peut ou pourra être dégagée à l'aide d'outils

statistiques# Les outils et techniques déjà disponibles en TAL permettent de

prendre en charge un premier dépistage# Ce dépistage peut appuyer ou alimenter l'intuition du linguiste

15

Page 49: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

ÉTUDE

Objectifs

# Dépister les formes qui semblent les plus symptomatiques d'unevariation potentielle (en général)

# Identifier automatiquement des traces de variation (diatopique pourcette présentation)

# Proposer au terminologue des pistes de réflexion pour compléterson intuition ou aiguiller sa recherche

# Mettre de l'avant une méthodologie qui se prête autant au travaillexicographique que terminographique

16

Page 50: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

ÉTUDE

Objectifs

# Dépister les formes qui semblent les plus symptomatiques d'unevariation potentielle (en général)

# Identifier automatiquement des traces de variation (diatopique pourcette présentation)

# Proposer au terminologue des pistes de réflexion pour compléterson intuition ou aiguiller sa recherche

# Mettre de l'avant une méthodologie qui se prête autant au travaillexicographique que terminographique

16

Page 51: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

ÉTUDE

Objectifs

# Dépister les formes qui semblent les plus symptomatiques d'unevariation potentielle (en général)

# Identifier automatiquement des traces de variation (diatopique pourcette présentation)

# Proposer au terminologue des pistes de réflexion pour compléterson intuition ou aiguiller sa recherche

# Mettre de l'avant une méthodologie qui se prête autant au travaillexicographique que terminographique

16

Page 52: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

ÉTUDE

Objectifs

# Dépister les formes qui semblent les plus symptomatiques d'unevariation potentielle (en général)

# Identifier automatiquement des traces de variation (diatopique pourcette présentation)

# Proposer au terminologue des pistes de réflexion pour compléterson intuition ou aiguiller sa recherche

# Mettre de l'avant une méthodologie qui se prête autant au travaillexicographique que terminographique

16

Page 53: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

MÉTHODOLOGIE

Page 54: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

Lescorpusutilisés

Constructeur Canada FranceAudi 130 463 819 195Bentley 15 677 46 214BMW 342 835 583 282Chevrolet 392 419 163 434Ford 674 228 765 728Honda 1 526 859 58 805Hyundai 118 264 398 242Infiniti 99 373 58 414KIA 344 153 56,335Landrover 78 337 83 938Lexus 93 114 70 609McLaren 8 494 12 696Nisan 123 139 475 201Porsche 1 118, 20 1 433 450Smart 38 227 51 359Volkswagen 463 092 468 979

18

Page 55: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

Lescorpusutilisés

Pays Canada FranceFormes 22,827 28,407Occurrences 4,147,354 5,240,698

19

Page 56: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

Préparationdescorpus

# Tous les corpus ont été aspirés du Web avec wget (disponible surplusieurs plateformes)

# Les corpus ont été convertis en format texte à l'aide de scriptsPython

# Certains sites comportaient d'importantes sections en anglais,elles ont été exclues (scripts Python)

Fiabilitédescorpus

# Les sites Web sont-ils réellement localisés ?# Le contenu des sites des constructeurs couvre différents aspects

(loi, marketing, véhicules, etc.)

20

Page 57: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

Préparationdescorpus

# Tous les corpus ont été aspirés du Web avec wget (disponible surplusieurs plateformes)

# Les corpus ont été convertis en format texte à l'aide de scriptsPython

# Certains sites comportaient d'importantes sections en anglais,elles ont été exclues (scripts Python)

Fiabilitédescorpus

# Les sites Web sont-ils réellement localisés ?# Le contenu des sites des constructeurs couvre différents aspects

(loi, marketing, véhicules, etc.)

20

Page 58: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

Préparationdescorpus

# Tous les corpus ont été aspirés du Web avec wget (disponible surplusieurs plateformes)

# Les corpus ont été convertis en format texte à l'aide de scriptsPython

# Certains sites comportaient d'importantes sections en anglais,elles ont été exclues (scripts Python)

Fiabilitédescorpus

# Les sites Web sont-ils réellement localisés ?# Le contenu des sites des constructeurs couvre différents aspects

(loi, marketing, véhicules, etc.)

20

Page 59: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

Préparationdescorpus

# Tous les corpus ont été aspirés du Web avec wget (disponible surplusieurs plateformes)

# Les corpus ont été convertis en format texte à l'aide de scriptsPython

# Certains sites comportaient d'importantes sections en anglais,elles ont été exclues (scripts Python)

Fiabilitédescorpus

# Les sites Web sont-ils réellement localisés ?

# Le contenu des sites des constructeurs couvre différents aspects(loi, marketing, véhicules, etc.)

20

Page 60: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

Préparationdescorpus

# Tous les corpus ont été aspirés du Web avec wget (disponible surplusieurs plateformes)

# Les corpus ont été convertis en format texte à l'aide de scriptsPython

# Certains sites comportaient d'importantes sections en anglais,elles ont été exclues (scripts Python)

Fiabilitédescorpus

# Les sites Web sont-ils réellement localisés ?# Le contenu des sites des constructeurs couvre différents aspects

(loi, marketing, véhicules, etc.)

20

Page 61: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

LesoutilsDeux outils ont été utilisés pour l'analyse des données.

IRaMuTeQInterface de R pour les Analyses Multidimensionnelles de Textes et deQuestionnairesOutil conçu par Pierre Ratinaud de Toulouse qui permet de procéderà diverses analyses statistiques sur des corpus assez volumineux.

DiatopixOutil conçu à l'OLST qui permet de visualiser de façon graphique larépartition de mots, de termes, d'expressions, etc. dans un espaceWeb délimité par une langue.Démonstration (?) : http://olst.ling.umontreal.ca/diatopix

21

Page 62: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

LesoutilsDeux outils ont été utilisés pour l'analyse des données.

IRaMuTeQInterface de R pour les Analyses Multidimensionnelles de Textes et deQuestionnairesOutil conçu par Pierre Ratinaud de Toulouse qui permet de procéderà diverses analyses statistiques sur des corpus assez volumineux.

DiatopixOutil conçu à l'OLST qui permet de visualiser de façon graphique larépartition de mots, de termes, d'expressions, etc. dans un espaceWeb délimité par une langue.Démonstration (?) : http://olst.ling.umontreal.ca/diatopix

21

Page 63: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

LesoutilsDeux outils ont été utilisés pour l'analyse des données.

IRaMuTeQInterface de R pour les Analyses Multidimensionnelles de Textes et deQuestionnairesOutil conçu par Pierre Ratinaud de Toulouse qui permet de procéderà diverses analyses statistiques sur des corpus assez volumineux.

DiatopixOutil conçu à l'OLST qui permet de visualiser de façon graphique larépartition de mots, de termes, d'expressions, etc. dans un espaceWeb délimité par une langue.Démonstration (?) : http://olst.ling.umontreal.ca/diatopix

21

Page 64: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

PourquoiIRaMuTeQ?

# La méthodologie est basée sur une intuition qu'il est possiblestatistiquement d'aller cibler les formes qui se comportentdifféremment d'un corpus à l'autre

# Le calculdesspécificités (Lafon 1984) permet d'identifier lesformes dont la fréquence dévie de la norme

# Trois types de résultats : les spécificités négatives, les formesbanales et les spécificitéspositives

# L'outil calcule les fréquences sur les lemmes# En plus du calcul des spécificités, une mise en opposition

présence/absence des corpus est utilisée# Pourquoi ne pas utiliser TermoStat ?

(http://termostat.ling.umontreal.ca)

22

Page 65: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

PourquoiIRaMuTeQ?

# La méthodologie est basée sur une intuition qu'il est possiblestatistiquement d'aller cibler les formes qui se comportentdifféremment d'un corpus à l'autre

# Le calculdesspécificités (Lafon 1984) permet d'identifier lesformes dont la fréquence dévie de la norme

# Trois types de résultats : les spécificités négatives, les formesbanales et les spécificitéspositives

# L'outil calcule les fréquences sur les lemmes# En plus du calcul des spécificités, une mise en opposition

présence/absence des corpus est utilisée# Pourquoi ne pas utiliser TermoStat ?

(http://termostat.ling.umontreal.ca)

22

Page 66: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

PourquoiIRaMuTeQ?

# La méthodologie est basée sur une intuition qu'il est possiblestatistiquement d'aller cibler les formes qui se comportentdifféremment d'un corpus à l'autre

# Le calculdesspécificités (Lafon 1984) permet d'identifier lesformes dont la fréquence dévie de la norme

# Trois types de résultats : les spécificités négatives, les formesbanales et les spécificitéspositives

# L'outil calcule les fréquences sur les lemmes# En plus du calcul des spécificités, une mise en opposition

présence/absence des corpus est utilisée# Pourquoi ne pas utiliser TermoStat ?

(http://termostat.ling.umontreal.ca)

22

Page 67: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

PourquoiIRaMuTeQ?

# La méthodologie est basée sur une intuition qu'il est possiblestatistiquement d'aller cibler les formes qui se comportentdifféremment d'un corpus à l'autre

# Le calculdesspécificités (Lafon 1984) permet d'identifier lesformes dont la fréquence dévie de la norme

# Trois types de résultats : les spécificités négatives, les formesbanales et les spécificitéspositives

# L'outil calcule les fréquences sur les lemmes

# En plus du calcul des spécificités, une mise en oppositionprésence/absence des corpus est utilisée

# Pourquoi ne pas utiliser TermoStat ?(http://termostat.ling.umontreal.ca)

22

Page 68: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

PourquoiIRaMuTeQ?

# La méthodologie est basée sur une intuition qu'il est possiblestatistiquement d'aller cibler les formes qui se comportentdifféremment d'un corpus à l'autre

# Le calculdesspécificités (Lafon 1984) permet d'identifier lesformes dont la fréquence dévie de la norme

# Trois types de résultats : les spécificités négatives, les formesbanales et les spécificitéspositives

# L'outil calcule les fréquences sur les lemmes# En plus du calcul des spécificités, une mise en opposition

présence/absence des corpus est utilisée

# Pourquoi ne pas utiliser TermoStat ?(http://termostat.ling.umontreal.ca)

22

Page 69: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

PourquoiIRaMuTeQ?

# La méthodologie est basée sur une intuition qu'il est possiblestatistiquement d'aller cibler les formes qui se comportentdifféremment d'un corpus à l'autre

# Le calculdesspécificités (Lafon 1984) permet d'identifier lesformes dont la fréquence dévie de la norme

# Trois types de résultats : les spécificités négatives, les formesbanales et les spécificitéspositives

# L'outil calcule les fréquences sur les lemmes# En plus du calcul des spécificités, une mise en opposition

présence/absence des corpus est utilisée# Pourquoi ne pas utiliser TermoStat ?

(http://termostat.ling.umontreal.ca)

22

Page 70: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

PourquoiDiatopix ?

# Validation des données obtenues à partir d'IRaMuTeQ

# Vérification externe des données obtenues sur un corpus assezlimité

# Visualisation assez utile des répartitions des formes dans les 2corpus

# Obtention de données chiffrées plus importantes sur lesrépartitions

23

Page 71: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

PourquoiDiatopix ?

# Validation des données obtenues à partir d'IRaMuTeQ# Vérification externe des données obtenues sur un corpus assez

limité

# Visualisation assez utile des répartitions des formes dans les 2corpus

# Obtention de données chiffrées plus importantes sur lesrépartitions

23

Page 72: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

PourquoiDiatopix ?

# Validation des données obtenues à partir d'IRaMuTeQ# Vérification externe des données obtenues sur un corpus assez

limité# Visualisation assez utile des répartitions des formes dans les 2

corpus

# Obtention de données chiffrées plus importantes sur lesrépartitions

23

Page 73: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

PourquoiDiatopix ?

# Validation des données obtenues à partir d'IRaMuTeQ# Vérification externe des données obtenues sur un corpus assez

limité# Visualisation assez utile des répartitions des formes dans les 2

corpus# Obtention de données chiffrées plus importantes sur les

répartitions

23

Page 74: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

Diatopix

24

Page 75: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

Diatopix

25

Page 76: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

LeslimitesdeDiatopix

# L'outil ne peut exploiter que les noms de domaine sur le Web

# La localisation est parfois trompeuse# Les résultats ne contiennent que ce qui est écrit et sur le Web# La polysémie peut jouer des drôles de tours

26

Page 77: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

LeslimitesdeDiatopix

# L'outil ne peut exploiter que les noms de domaine sur le Web# La localisation est parfois trompeuse

# Les résultats ne contiennent que ce qui est écrit et sur le Web# La polysémie peut jouer des drôles de tours

26

Page 78: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

LeslimitesdeDiatopix

# L'outil ne peut exploiter que les noms de domaine sur le Web# La localisation est parfois trompeuse# Les résultats ne contiennent que ce qui est écrit et sur le Web

# La polysémie peut jouer des drôles de tours

26

Page 79: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

MÉTHODOLOGIE

LeslimitesdeDiatopix

# L'outil ne peut exploiter que les noms de domaine sur le Web# La localisation est parfois trompeuse# Les résultats ne contiennent que ce qui est écrit et sur le Web# La polysémie peut jouer des drôles de tours

26

Page 80: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

RÉSULTATS

Page 81: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

VALIDATION DES DONNÉES

Validationdesdonnées

# Validation manuelle des données

# Exploitation des 4 principales sources :◦ IATE◦ Le grand dictionnaire terminologique◦ TermiumPlus◦ Usito

# Sources suffisantes dans la majorité des cas, parfois appel àexperts

# Forme est jugée pertinente quand son sens est relié au domainede l'industrie automobile

28

Page 82: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

VALIDATION DES DONNÉES

Validationdesdonnées

# Validation manuelle des données# Exploitation des 4 principales sources :

◦ IATE◦ Le grand dictionnaire terminologique◦ TermiumPlus◦ Usito

# Sources suffisantes dans la majorité des cas, parfois appel àexperts

# Forme est jugée pertinente quand son sens est relié au domainede l'industrie automobile

28

Page 83: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

VALIDATION DES DONNÉES

Validationdesdonnées

# Validation manuelle des données# Exploitation des 4 principales sources :

◦ IATE◦ Le grand dictionnaire terminologique◦ TermiumPlus◦ Usito

# Sources suffisantes dans la majorité des cas, parfois appel àexperts

# Forme est jugée pertinente quand son sens est relié au domainede l'industrie automobile

28

Page 84: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

VALIDATION DES DONNÉES

Validationdesdonnées

# Validation manuelle des données# Exploitation des 4 principales sources :

◦ IATE◦ Le grand dictionnaire terminologique◦ TermiumPlus◦ Usito

# Sources suffisantes dans la majorité des cas, parfois appel àexperts

# Forme est jugée pertinente quand son sens est relié au domainede l'industrie automobile

28

Page 85: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

Présence/absence

# Formes présentes dans le corpus Canada uniquement : 1343 (f.10-3299)

# Formes présentes dans le corpus France uniquement : 1993 (f.10-3452)

# Analyse des 200 premières formes dans chacune des listes# Filtrage des noms de lieux, de modèles et des abréviations# Listes résultantes : 60 pour le Canada et 20 pour la France

29

Page 86: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

Présence/absence

# Formes présentes dans le corpus Canada uniquement : 1343 (f.10-3299)

# Formes présentes dans le corpus France uniquement : 1993 (f.10-3452)

# Analyse des 200 premières formes dans chacune des listes# Filtrage des noms de lieux, de modèles et des abréviations# Listes résultantes : 60 pour le Canada et 20 pour la France

29

Page 87: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

Présence/absence

# Formes présentes dans le corpus Canada uniquement : 1343 (f.10-3299)

# Formes présentes dans le corpus France uniquement : 1993 (f.10-3452)

# Analyse des 200 premières formes dans chacune des listes

# Filtrage des noms de lieux, de modèles et des abréviations# Listes résultantes : 60 pour le Canada et 20 pour la France

29

Page 88: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

Présence/absence

# Formes présentes dans le corpus Canada uniquement : 1343 (f.10-3299)

# Formes présentes dans le corpus France uniquement : 1993 (f.10-3452)

# Analyse des 200 premières formes dans chacune des listes# Filtrage des noms de lieux, de modèles et des abréviations

# Listes résultantes : 60 pour le Canada et 20 pour la France

29

Page 89: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

Présence/absence

# Formes présentes dans le corpus Canada uniquement : 1343 (f.10-3299)

# Formes présentes dans le corpus France uniquement : 1993 (f.10-3452)

# Analyse des 200 premières formes dans chacune des listes# Filtrage des noms de lieux, de modèles et des abréviations# Listes résultantes : 60 pour le Canada et 20 pour la France

29

Page 90: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

Canada

30

Page 91: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

Canada-Fréquence

Forme Complexesedantélédéverrouillageantirouille traitement antirouilleinfoloisirs système infoloisirshydro-électrique servodirection hydro-électriquesous-marinage rampe de sous-marinagemultiplace cabine multiplaceécoénergétique moteur écoénergétique

31

Page 92: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

France

32

Page 93: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

France-Fréquence

Forme Complexesurteintées lunette surteintéelabélisés concessionnaire labélisémonospaceradiocommande clé pliante de radiocommandedéconnectable airbag déconnectableinfotainmentcamping-carcandyathermique parebrise athermiqueallume-cigareprésignalisation triangle de présignalisationrépétiteur répétiteur de clignotantmajoré loyer majorétweeters

33

Page 94: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

Spécificités

# Le calcul est effectué sur l'ensemble des formes du corpus

# Seules les 20 premières spécificités positives ont été analysées

34

Page 95: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

Spécificités

# Le calcul est effectué sur l'ensemble des formes du corpus# Seules les 20 premières spécificités positives ont été analysées

34

Page 96: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

Canada

35

Page 97: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

Canada-Spécificités

Forme Complexeservodirection servodirection hydro-électriquecote cote de consommationfrein freins antiblocage ABS

36

Page 98: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

France

37

Page 99: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

RÉSULTATS

France-Spécificités

Forme Complexesellerieloyerbusiness gamme businessconcept concept carcarburant

38

Page 100: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

CONCLUSION

Page 101: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

CONCLUSION

Conclusion

# Il est possible d'appuyer le lexicographe ou le terminologue dans ledépistage des variantes diatopiques

# Les résultats sont bruités# La simple technique de comparaison présence/absence donne

des résultats surprenants (8/20 et 14/20)# Les résultats du calcul des spécificités sont plus denses d'un point

de vue terminologique# La performance de la spécificité n'est pas aussi intéressante pour

la variation diatopique (3/20 et 5/20)

40

Page 102: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

CONCLUSION

Conclusion

# Il est possible d'appuyer le lexicographe ou le terminologue dans ledépistage des variantes diatopiques

# Les résultats sont bruités

# La simple technique de comparaison présence/absence donnedes résultats surprenants (8/20 et 14/20)

# Les résultats du calcul des spécificités sont plus denses d'un pointde vue terminologique

# La performance de la spécificité n'est pas aussi intéressante pourla variation diatopique (3/20 et 5/20)

40

Page 103: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

CONCLUSION

Conclusion

# Il est possible d'appuyer le lexicographe ou le terminologue dans ledépistage des variantes diatopiques

# Les résultats sont bruités# La simple technique de comparaison présence/absence donne

des résultats surprenants (8/20 et 14/20)

# Les résultats du calcul des spécificités sont plus denses d'un pointde vue terminologique

# La performance de la spécificité n'est pas aussi intéressante pourla variation diatopique (3/20 et 5/20)

40

Page 104: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

CONCLUSION

Conclusion

# Il est possible d'appuyer le lexicographe ou le terminologue dans ledépistage des variantes diatopiques

# Les résultats sont bruités# La simple technique de comparaison présence/absence donne

des résultats surprenants (8/20 et 14/20)# Les résultats du calcul des spécificités sont plus denses d'un point

de vue terminologique

# La performance de la spécificité n'est pas aussi intéressante pourla variation diatopique (3/20 et 5/20)

40

Page 105: Séminaire DELICORTAL - lidilem.u-grenoble3.frlidilem.u-grenoble3.fr/IMG/pdf/grenoble2016.pdf · # IAxe lexicologie et lexicographie # IIAxe terminographie # IIIAxe traitement de

. ..

CONCLUSION

Conclusion

# Il est possible d'appuyer le lexicographe ou le terminologue dans ledépistage des variantes diatopiques

# Les résultats sont bruités# La simple technique de comparaison présence/absence donne

des résultats surprenants (8/20 et 14/20)# Les résultats du calcul des spécificités sont plus denses d'un point

de vue terminologique# La performance de la spécificité n'est pas aussi intéressante pour

la variation diatopique (3/20 et 5/20)

40