TRAITEMENT INSTRUMENTÉ DE CORPUS Hakim HESSAS. LE TRAITEMENT INSTRUMENTÉ DE CORPUS…

Preview:

Citation preview

TRAITEMENT INSTRUMENTÉ DE CORPUS

Hakim HESSAS

LE TRAITEMENT INSTRUMENTÉ DE CORPUS…

LE TRAITEMENT INSTRUMENTÉ DE CORPUS…

Un traitement de corpus de textes par des logiciels qui a révolutionné de fond en comble la linguistique et les disciplines des sciences humaines, depuis l’accès numérique à l’écrit.

Le renouvellement tient principalement en deux points :

Le renouvellement tient principalement en deux points :

Le fait de travailler sur des corpus de textes numériques ;

Le renouvellement tient principalement en deux points :

Le fait de travailler sur des corpus de textes numériques ;

L’assistance qu’apportent les logiciels.

Le traitement instrumenté de corpus n’est pas le traitement de corpus.

Le traitement instrumenté de corpus n’est pas le traitement de corpus.

Il en constitue une partie nécessaire mais non suffisante.

Le traitement instrumenté de corpus n’est pas le traitement de corpus.

Il en constitue une partie nécessaire mais non suffisante.

Celle-ci doit se compléter, à chaque fois, par une autre aussi importante, à savoir l’interprétation des DONNÉES –

Le traitement instrumenté de corpus n’est pas le traitement de corpus.

Il en constitue une partie nécessaire mais non suffisante.

Celle-ci doit se compléter, à chaque fois, par une autre aussi importante, à savoir l’interprétation des DONNÉES – passer des chaînes de caractères à des formes sémantiques.

Les données sont celles que l’on se donne pour construire des parcours thématiques précis, à partir d’hypothèses…

Les données sont celles que l’on se donne pour construire des parcours thématiques précis, à partir d’hypothèses…

Ces hypothèses peuvent être posées lors de la conception de corpus ou lors de la détermination des tâches.

Les données sont celles que l’on se donne pour construire des parcours thématiques précis, à partir d’hypothèses…

Ces hypothèses peuvent être posées lors de la conception de corpus ou lors de la détermination des tâches.

Elles déterminent le choix des textes qui entrent dans la composition du corpus.

Quelques points revêtent une portée épistémologique importante pour toute recherche linguistique, sociologique ou autre :

Quelques points revêtent une portée épistémologique importante pour toute recherche linguistique, sociologique ou autre :

1. L’importance du corpus

Quelques points revêtent une portée épistémologique importante pour toute recherche linguistique, sociologique ou autre :

1) L’importance du corpus 2) La constitution du corpus

Quelques points revêtent une portée épistémologique importante pour toute recherche linguistique, sociologique ou autre :

1) L’importance du corpus 2) La constitution du corpus3) Connaissance des instruments de

connaissance

1. L’IMPORTANCE DU CORPUS DE TEXTES

1. L’IMPORTANCE DU CORPUS DE TEXTES

L’objet d’étude de la linguistique ce sont les textes que l’on peut organiser en CORPUS – non les mots ou les phrases isolés.

1. L’IMPORTANCE DU CORPUS DE TEXTES

L’objet d’étude de la linguistique ce sont les textes que l’on peut organiser en CORPUS – non les mots ou les phrases isolés.

Un mot ne se laisse comprendre que par ses multiples emplois et ses rapports divers à d’autres mots (contexte et récurrence).

2. LA CONSTITUTION DE CORPUS

2. LA CONSTITUTION DE CORPUS

Toute compilation de textes ne peut constituer un corpus.

2. LA CONSTITUTION DE CORPUS

Toute compilation de textes ne peut constituer un corpus.

Un corpus doit être construit à partir d’un point de vue bien clair.

2. LA CONSTITUTION DE CORPUS

Toute compilation de textes ne peut constituer un corpus.

Un corpus doit être construit à partir d’un point de vue bien clair.

Ce point de vue correspond à un choix théorique et méthodologique.

… LE CONCEPT DE CORPUS

… LE CONCEPT DE CORPUS

Il n’existe pas de corpus naturel

… LE CONCEPT DE CORPUS

Il n’existe pas de corpus naturel Un mot n’a de sens que dans un contexte

… LE CONCEPT DE CORPUS

Il n’existe pas de corpus naturel Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits

sémantiques

… LE CONCEPT DE CORPUS

Il n’existe pas de corpus naturel Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits

sémantiques Le sens est également fait de différences

… LE CONCEPT DE CORPUS

Il n’existe pas de corpus naturel Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits

sémantiques Le sens est également fait de différences Il est nécessaire d’avoir un contexte plus

large

… LE CONCEPT DE CORPUS

Il n’existe pas de corpus naturel Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits

sémantiques Le sens est également fait de différences Il est nécessaire d’avoir un contexte plus

large Le contexte c’est tous les textes

… LE CONCEPT DE CORPUS

Il n’existe pas de corpus naturel Un mot n’a de sens que dans un contexte Le sens est un réseau structuré de traits

sémantiques Le sens est également fait de différences Il est nécessaire d’avoir un contexte plus

large Le contexte c’est tous les textes L’objectif n’est pas d’avoir une grande masse

de textes (du texte) mais (des textes)

a) L’IMPORTANCE DU POINT DE VUE

a) L’IMPORTANCE DU POINT DE VUE

Un point de vue n’est pas un point d’observation.

a) L’IMPORTANCE DU POINT DE VUE

Un point de vue n’est pas un point d’observation. Mais un point à partir duquel on construit un

corpus comme objet scientifique exploitable.

B. SPÉCIFICATION DES GENRES

B. SPÉCIFICATION DES GENRES

Il est nécessaire de spécifier et de définir les genres lors de la constitution de corpus.

B. SPÉCIFICATION DES GENRES

Il est nécessaire de spécifier et de définir les genres lors de la constitution de corpus.

La meilleure interprétation se fait au sein d’un corpus de textes qui partagent le même genre.

B. SPÉCIFICATION DES GENRES

Il est nécessaire de spécifier et de définir les genres lors de la constitution de corpus.

La meilleure interprétation se fait au sein d’un corpus de textes qui partagent le même genre.

Principe :

B. SPÉCIFICATION DES GENRES

Il est nécessaire de spécifier et de définir les genres lors de la constitution de corpus.

La meilleure interprétation se fait au sein d’un corpus de textes qui partagent le même genre.

Principe : si le sens est fait de différence ce n’est pas pour comparer l’incomparable (les montagnes et les petits pois).

3. LES LOGICIELS: INSTRUMENTS DE CONNAISSANCE DU CORPUS

Les logiciels permettent de traiter le lexique comme des choses (Durkheim) ;

Ce sont des instruments transcendant qui permettent une totalisation (P. Bourdieu, 2012 : 338) ;

Accéder immédiatement dans le corpus ; Choisir des points d’entrée intéressants dans

le corpus ; Trouver autre chose que ce l’on cherche.

CONCLUSION

CONCLUSION

Les statistiques que permettent les logiciels n'ont pas de sens et de portée en elles-mêmes; elles doivent être exploitées et surtout interprétées ;

CONCLUSION

Les statistiques que permettent les logiciels n'ont pas de sens et de portée en elles-mêmes; elles doivent être exploitées et surtout interprétées ;

L'existence de lexèmes n'est guère une garantie sur l'existence d'un thème ;

CONCLUSION

Les statistiques que permettent les logiciels n'ont pas de sens et de portée en elles-mêmes; elles doivent être exploitées et surtout interprétées ;

L'existence de lexèmes n'est guère une garantie sur l'existence d'un thème ;

des mots absents peuvent tout autant signifier que les mots présents ;

La force théorique de la linguistique de corpus ne consiste pas à offrir des instruments qui permettent de résoudre toutes les énigmes textuelles, mais de pouvoir donner à des hypothèses pertinemment posées des possibilités de confirmation ou d'infirmation ;

La force théorique de la linguistique de corpus ne consiste pas à offrir des instruments qui permettent de résoudre toutes les énigmes textuelles, mais de pouvoir donner à des hypothèses pertinemment posées des possibilités de confirmation ou d'infirmation ;

Si la mesure ne se suffit pas a elle-même, l'interprétation des données ne peut se faire que si l'on prend connaissance du discours, du genre du texte en question. La grammaticalité d'une phrase suit les mêmes critères ;

La force théorique de la linguistique de corpus ne consiste pas à offrir des instruments qui permettent de résoudre toutes les énigmes textuelles, mais de pouvoir donner à des hypothèses pertinemment posées des possibilités de confirmation ou d'infirmation ;

Si la mesure ne se suffit pas a elle-même, l'interprétation des données ne peut se faire que si l'on prend connaissance du discours, du genre du texte en question. La grammaticalité d'une phrase suit les mêmes critères ;

Le sens d'un mot - ou d'un texte - dépend donc des parcours interprétatifs construits à chaque fois, que les logiciels ne font que suggérer.

Qui a vu un monument n'en a vu aucun ; qui en a vu mille en a vu un.

Édouard Gérard

Recommended