20
Apprentissage des langues 1 Verdenet Valérie Othman Dhiffallah M2 IDL TAL et apprentissage des langues Enrichissement De la base Games of words

Enrichissement de la base de game of words

Embed Size (px)

Citation preview

Page 1: Enrichissement de la base de game of words

Apprentissage des langues

1

Verdenet Valérie

Othman Dhiffallah

M2 IDL

TAL et apprentissage des langues

Enrichissement

De la base Games of words

Page 2: Enrichissement de la base de game of words

Sommaire I. Besoin : ........................................................................................................................................... 3

II. Enjeu du programme ...................................................................................................................... 3

III. L’existant .................................................................................................................................... 4

A. Les outils à la disposition des apprenants .................................................................................. 4

B. Limites de l’existant : .................................................................................................................. 6

1. Différents outils connus .......................................................................................................... 6

2. Notre application .................................................................................................................... 6

IV. Les solutions envisagées ............................................................................................................. 8

V. Difficultés ....................................................................................................................................... 8

VI. Intérêt du TAL dans notre projet ................................................................................................ 9

A. Les ressources lexicales .............................................................................................................. 9

1. Wordnet ................................................................................................................................. 9

2. Diko ...................................................................................................................................... 10

3. Leur utilité ............................................................................................................................ 11

VII. Application ............................................................................................................................... 13

A. Stratégie de programmation .................................................................................................... 13

1. Définition générale, .............................................................................................................. 13

2. Les différentes possibilités ................................................................................................... 13

3. Notre choix ........................................................................................................................... 14

4. Qu’est-ce qu’une bonne carte tabou ? ................................................................................. 15

5. Qu’est-ce qu’un bon mot interdit ? ...................................................................................... 15

6. Qu’est-ce qu’un mot qui nous vient facilement à l’esprit ? .................................................. 15

7. Questions supplémentaires à se poser : ............................................................................... 17

B. L’algorithme idéale envisagée pour un apprenant A1-A2 ........................................................ 17

VIII. Conclusion : Bilan sur notre réalisation et perspectives ........................................................... 18

A. Notre réalisation....................................................................................................................... 18

B. Perspectives ............................................................................................................................. 18

Page 3: Enrichissement de la base de game of words

Apprentissage des langues

3

I. Besoin :

Sur le jeu « Game of Words », permettre la génération automatique de nouvelles cartes à partir de

ressources sémantiques.

II. Enjeu du programme

Ce jeu repose sur le principe du jeu du « Tabou » : faire deviner un mot sans utiliser une liste de mots

prédéfinie. Le but de « Game of Words » étant de favoriser la production et la compréhension orale.

Le nombre de mots interdits peut varier en fonction du niveau de l’apprenant.

L’interaction se passe de manière asynchrone :

- Un locuteur, nommé Oracle, s’enregistre entrain de définir le terme sans utiliser ceux qui lui

sont interdits

o 1 pour le niveau débutant

o 3 pour le niveau intermédiaire

o 6 pour le niveau expérimenté.

- Un locuteur, nommé Devin, qui écoutera la description et devra deviner en tapant ses

proposition dans un formulaire.

- On peut être soit l’un soit l’autre.

- Un autre rôle existe, Druide, qui permet à l’utilisateur de créer ses propres cartes. Il a

également une fonction d’arbitrage. Sans lui, on ne peut savoir si l’Oracle n’a pas prononcé

un des mots interdits ou celui à faire deviner.

Avec ces trois possibilités, on offre aux apprenants d’accroître leurs compétences

communicationnelles de manière ludique et en autonomie. Via la fonction Oracle, ils pourront

s’entraîner à l’oral sans passer par des textes appris et des dialogues artificiels. Ils pourront

approcher un peu plus une communication orale plus spontanée qui permettrait de véritables

échanges avec des natifs. En effet, les non natifs sont souvent gênés par certaines locutions qui

nécessitent un bagage culturel. Permettre d’avoir une élocution et une compréhension plus fluide

aiderait à approcher cet aspect de la langue. Le problème est que les apprenants d’une langue ne

font pas forcément dans le but de communiquer avec des natifs :

« Already many people who learn English do so with little or no intention of conversing with its native

users »

De plus, il devient nécessaire de maîtriser une langue étrangère pour être intégré au sein des

entreprises. Dans le cas de l’anglais, les entreprises britanniques se trouvent confrontées à ce

problème pour exporter. On prédit que d’ici quelques années, les compétences en anglais ne seront

plus un facteur de compétitivité dans les pays non anglophones.

« Moreover, there is a chance that a command of English will within twenty or thirty years be

regarded as a basic skill for business, and native speakers of the language will no longer enjoy any

competitive advantage ».

Page 4: Enrichissement de la base de game of words

Apprentissage des langues

4

Il devient donc essentiel de pouvoir développer d’avantages de compétences linguistiques, autres

que l’anglais des affaires1.

Cette application fait partie du projet Innovalangues2 dont le but est de « doter les institutions

d’enseignements supérieures de moyens fédérant et amplifiant les actions de formations en langues

destinées à porter le degré de maîtrise en langues des publics à un niveau B2 certifié ». L’apprenant

doit pouvoir acquérir un certain niveau d’aisance dans la langue étrangère. Développer cette

application s’inscrit dans l’objectif d’innovation en termes de pédagogie, pour s’adapter aux

différentes techniques d’apprentissages.

III. L’existant

A. Les outils à la disposition des apprenants Nous pouvons observer qu’un apprenant a déjà la possibilité d’utiliser l’informatique pour progresser

en langue. Voici une liste non exhaustive de ce que nous pouvons trouver.

- Anglais facile http://www.anglaisfacile.com/

o Propose des cours en ligne

o Des petits exercices basés sur un système de questions-réponses

o Pas d’explications sur les erreurs

o Possibilité de créer des tests

Demande l’intervention des utilisateurs pour enrichir la base de données

o Existe dans d’autres langues

- http://www.didieraccord.com/exercices/index.php?ex=4.3.5

o Cours en lignes

1 http://www.salon.com/2011/11/06/whats_the_language_of_the_future/

2 www.researchgate.net/publication/271852910

Page 5: Enrichissement de la base de game of words

Apprentissage des langues

5

o Exercices

o Pas d’explication pour les erreurs

- https://francais.lingolia.com/fr/grammaire/les-temps/le-present/exercices

o Propose des cours thématiques

o Propose des exercices

o Explique les erreurs

o Pas de renouvellement des exercices qui pourrait conduire à la mémorisation des

bonnes réponses plus que des explications.

- Conjugueurs en ligne

o Bescherelle

Exercices et conjugueurs en ligne

Les erreurs ne sont pas expliquées. La bonne réponse est simplement

donnée sans redirection possible vers la règle à appliquer. L’apprenant ne

peut pas l’utiliser pour progresser.

Ce site reste une vitrine commerciale pour diffuser ses ouvrages.

- Dictionnaires en ligne

Ne proposent pas d’exercices interactifs

- Projet Voltaire

o Site proposant une solution pour améliorer l’expression écrite dans les entreprises

Page 6: Enrichissement de la base de game of words

Apprentissage des langues

6

o Le test d’évaluation que les utilisateurs peuvent faire avant de s’inscrire ne propose

pas une explication des erreurs. Il s’agit d’un simple formulaire avec une note.

o Pas de réelle correction sur cette première approche.

B. Limites de l’existant :

1. Différents outils connus

Tous ces sites ont leur utilité et peuvent être un excellent support pour améliorer ses compétences

linguistiques. Cependant, ils n’utilisent pas des ressources du TAL qui pourraient permettre d’enrichir

les bases de données en termes de ressources lexicales et renouveler les exercices pour en proposer

de nouveau et éviter le phénomène du par cœur dans des situations artificielles.

2. Notre application3

Dans ce jeu, la création de cartes reste limitée.

En effet, l’apprenant, selon son niveau, ne dispose pas obligatoirement de toutes les ressources

sémantiques nécessaires. Pour générer ce qu’on peut considérer comme une bonne carte de Tabou ;

c’est à dire une carte qui permettra d’élaborer des stratégies de communication4. Il pourrait être

intéressant de bénéficier d’une génération automatique des cartes afin de ne pas rester limiter à

quelques mots seulement. Il en va de même pour les enseignants.

A terme la base de données qui contient les cartes à générer risque de s’épuiser. Nous devons

trouver une solution pour proposer une aide pour le renouvellement de cette partie du programme.

Les utilisateurs doivent pouvoir continuellement enrichir la plateforme. Les liens sémantiques qui

permettent d’accéder aux lexiques ne sont pas forcément ceux que nous attendons.

Le programme est lié à la rubrique diko du site jeuxdemots.org pour pouvoir générer des cartes en

fonction de la fréquence d’utilisation des mots. Le site en question est un moyen ludique pour

collecter et hiérarchiser les liens que nous faisons entre les mots. Ils sont classés selon leur lien

sémantique avec les mots recherchés (synonyme, antonyme, hyperonyme, association d’idée…).

Cependant, ce dictionnaire est enrichi par des natifs du français et leur propositions peuvent être liés

avec leur culture. Par exemple pour le mot chien nous retrouvons Milou qui n’est pas forcément

connu par des non-natifs :

3 http://gamer.innovalangues.net/gameofwords

4 Cadre Européen Commun de Référence pour les Langues

Page 7: Enrichissement de la base de game of words

Apprentissage des langues

7

- Les races de chiens sont très peu évoquées contrairement à d’autres animaux proches

comme chat.

Nous pouvons constater le même phénomène pour l’anglais :

- Il ne s’agit pas forcément des mêmes associations d’idées en anglais qu’en français. (mot

familiers, diminutif d’un autre mot…). C’est d’ailleurs le problème rencontré dans le cas de la

conception de traducteurs automatiques. Les expressions idiomatiques ne sont pas toujours

bien prises en compte.

o En anglais, les expressions françaises « tartempion » ou « untel » sont traduites par

« John Doe » qui est également le nom d’un personnage de série.

o Quand un locuteur non natif de l’anglais se retrouve confronté à ce mot, il ne

pensera pas obligatoirement à « Tartempion » ou l’équivalent dans sa langue

maternelle. Il y a un risque que cela lui évoque la série éponyme.

Dans le programme nous devons tenir compte de ces différents éléments qui sont liés à la culture de

la langue, au contexte de communication et aux besoins des apprenants.

De plus la génération automatique telle qu’elle est conçue peut donner des réponses énigmatiques, y

compris pour un locuteur natif du français.

Nous pouvons le constater dans cet exemple de génération automatique

Le mot à trouver a été choisi de manière aléatoire en utilisant les identifiants numériques attribués à

chaque mot du diko. Avec la commande mt_rand(0, 100000) qui est une fonciton mathématique qui

Page 8: Enrichissement de la base de game of words

Apprentissage des langues

8

permet de choisir au hasard un nombre. Seulement, l’apprenant peut se retrouver avec des mots

dont il n’aura pas nécessairement l’utilité et qu’il pourra difficilement définir, comme dans l’exemple

ci-dessus, à moins qu’il ne suive une formation spécialisée en zoologie le soit déjà dans sa propre

langue.

IV. Les solutions envisagées

Nous pouvons déjà envisager différentes possibilités :

- La redirection vers des dictionnaires en ligne où il existe une forme de hiérarchisation avec

un guide d’utilisation

o Le risque est de perdre l’utilisateur dans toute la documentation et de le démotiver

dans son acte langagier.

- La mise en place un programme qui fait des suggestions par rapport à ces ressources en

ligne.

o l’utilisateur serait guider et un premier tri serait fait dans ses options pour choisir les

mots tabous adéquats.

V. Difficultés

Le problème vient de la gestion des ressources sémantiques à disposition. Elles sont variées selon les

langues. Il n’y a pas non plus les mêmes nuances d’une langue l’autre, voire d’un pays à l’autre d’une

même langue.

- Exemple quatre-vingt en français de France et octante ou huitante en français de Suisse

selon la région.

Nous devons nous poser la question du choix à faire en ce qui concerne la prise en compte des

variantes linguistiques. Il faudra se demander si nous nous basons sur la norme du pays « source »

(France pour français, Grande Bretagne pour l’anglais…), sachant que certains vocabulaires sont plus

présents (est-ce que l’anglais US et plus populaire que l’anglais UK?). En général, les enseignants font

des choix selon des critères qu’ils doivent pouvoir justifier et qui répond à une logique

d’apprentissage. Nous devrons aussi le faire appliquer à la machine. Dans un premier temps nous

partirons du postulat que les équivalences régionales ne sont pas majoritaires, que les ressources

dont nous disposons sont suffisamment complètes et nous utiliserons un système en rapport à la

fréquence d’utilisation des mots. Nous envisagerons la possibilité aux utilisateurs les plus avancés de

proposer leurs propres mots tabous.

L’idéal serait d’utiliser wordnet qui commence à créer des ressources autres qu’en anglais (arabe),

mais seule la version anglaise est consultable en ligne, les autres doivent être téléchargées et

certaines sous conditions. IL faudra toujours être en veille de mise à jour de la base qu’il faudra

régulièrement re-télécharger, contrairement à une ressource en ligne, pour pouvoir générer de

nouvelles cartes.

Page 9: Enrichissement de la base de game of words

Apprentissage des langues

9

VI. Intérêt du TAL dans notre projet Notre tâche sera de déterminer quelles ressources utiliser, dans quel but et comment. Nous

envisagerons la meilleure manière d’utiliser le TAL pour automatiser la plupart des tâches et fournir

le meilleur confort d’apprentissage.

A. Les ressources lexicales

1. Wordnet

Même si dans un premier temps nous nous focaliserons sur le français, il est intéressant d’étudier les

ressources dont nous disposons en anglais, d’autant plus que le projet de wornet semble de s’élargir

à d’autres langue.

c’est une base de données lexicale créée manuellement par des linguistes dans le but d’accéder à des

ressources sémantiques. L’utilisateur à la possibilité de sélectionner la manière dont les entrées

seront affichées, (fréquence d’utilisation…). Cela permet d’avoir une vue d’ensemble pour pouvoir

étudier les liens sémantiques et de les classer selon leur utilisation.

L’organisation repose sur les « synset » (synonym set)5 : Il y a autant d’entrées lexicales qu’il y a de

mots. Ce système s’utilise comme une ontologie grâce aux relations sémantique existantes.

Exemple : sens le plus commun du mot « car » dans une relation d’hyperonymie

5 https://fr.wikipedia.org/wiki/WordNet

Illustration 1: code de l'interface wordnet pour le classement des relations

sémantiques

Page 10: Enrichissement de la base de game of words

Apprentissage des langues

10

Dans cet exemple, le dernier concept, « entité, quelque chose », est le plus général, le plus abstrait. Il

pourrait ainsi être le super-concept d'une multitude de concepts plus spécialisés

Wordnet existe dans d’autres langues. En ce qui concerne le français, il s’agit d’une traduction

automatique de Wordnet 3 et fait l’objet d’une validation manuelle partielle. Nous pouvons nous

interroger sur la fiabilité de cette version.

En ce qui concerne les autres langues, il s’agit de produits payants.

2. Diko

Utilise la coopération des utilisateurs à travers un jeu d’associations d’idées autour d’un mot

proposé. Dans l’application en ligne jeudemots.org

1proposition d'un mot

Page 11: Enrichissement de la base de game of words

Apprentissage des langues

11

2mise en place des résultats avec un système de points pour encourager les utilisateurs à

jouer

3 classement dans le diko en fonction de la relation sémantique et de la fréquence

d'utilisation

4 exemple avec les associations d'idées

On peut observer que les termes sont classés pas importance d’utilisation et que plus le mot est

fréquent, plus la taille de la police de caractère est grande.

3. Leur utilité

Ces ressources sont prévues, dans notre cas, pour permettre d’enrichir les bases de données

d’applications comme celles de « game of word ». Les développeurs peuvent créer des liens vers ces

plateformes tout dépendra de la manière dont ils prévoient l’utilisation du logiciel.

Le but initial du projet est de ne pas faire de distinctions entre les stauts (enseignants, apprenants)

pour conserver le caractère informel du jeu. Néanmoins cette différence existe et nous devons en

tenir compte pour adapter les aides en fonction des niveaux et des objectifs propres à chacun. Nous

pourrions envisager, dans notre application, de donner des accès à la génération de cartes selon le

Page 12: Enrichissement de la base de game of words

Apprentissage des langues

12

statut et le niveau de langue selon le classement du CECR6. Plusieurs options sont envisageables. Il

nous appartiendra de les lister afin d’envisager la meilleure solution.

a) Création pour les enseignants

L’aspect lexical n’est pas au centre du projet, il s’agit surtout d’inciter les apprenants à développer

des stratégies communicatives lors des enregistrements. Ils ne pourront ni prononcer le mot à faire

deviner, ni la liste de mots tabous. Il est important que les enseignants connaissent les mots les plus

utilisés pour pouvoir les interdire et rendre les parties plus intéressantes pour les élèves.

Nous partons du principe que l’enseignant maîtrise la langue étrangère qu’il enseigne et que pour lui

il faudra surtout une aide complémentaire à ses enseignements pour le conforter dans ses objectifs.

Nous pourrions lui proposer de simples liens vers des dictionnaires en ligne où il pourrait avoir accès

à l’ensemble du champ lexical du thème abordé.

Il faut tenir compte du fait que les mots ne sont pas obligatoirement associés au vocabulaire attendu.

Exemple :

- En cherchant les termes associés à « chien » dans www.jeuxdemots.org/diko.php on observe

que ceux-ci n’ont pas obligatoirement un lien sémantique7 fort avec le mot à faire deviner.

o Canidé est un hyperonyme. Nous pouvons considérer que le lien est fort car chien

appartient à la race des canidés et ont une racine latine commune.

o Milou (noté en plus gros et donc avec une fréquence plus forte que canidé) est une

association d’idée. Nous pouvons considérer que le lien sémantique est faible car il

fait appelle aux connaissances du locuteurs, plus qu’à la sémantique. Si un français

connaît la référence, il n’est sera pas obligatoirement de même pour un non-natif

Nous ne pourrons donc pas nous contenter de poser des liens thématiques pour cette section. Il

serait judicieux de proposer une manière de relier ses dictionnaires thématiques à un outil d’analyse

statistiques pour travailler en priorité le vocabulaire utilisé le plus souvent.

6 Cadre Européen Commun de Référence

7 Relation mettant en évidence les liens de signification entre les termes ou les classes d'un

langage documentaire. http://www.adbs.fr/relation-semantique-18448.htm?RH=OUTILS_VOC

Page 13: Enrichissement de la base de game of words

Apprentissage des langues

13

b) Création pour les apprenants

Les apprenants auront certainement besoin d’être un peu plus aidés que les enseignants. Nous

devrons tenir compte de son niveau de langue selon les normes établies par le CECR pour définir

comment les orienter dans la création des cartes sans que cela soit trop facile ou trop complexe.

Par exemple, devons-nous autoriser un étudiant de niveau A1 (au tout début de l’apprentissage) à

créer une carte et dans quelle mesure ? Ne devons-nous pas laisser plus de liberté à un étudiant de

niveau C1/C2 qui pourrait être proche de celui de l’enseignant et avec une plus grande autonomie

linguistique ?

Tous apprennent les langues étrangères avec des aptitudes et des objectifs différents. Il faudra en

tenir compte puisque le but est accéder à des compétences linguistiques avec une notion de plaisir.

Pour cette partie de la génération de cartes, il faudra prévoir plus que de simples liens vers des

dictionnaires en ligne avec des outils statistiques. Dans l’idéal, il serait opportun de pouvoir importer

directement la liste des mots réellement intéressants à intégrer dans les cartes selon le thème

choisis.

- Un étudiant de niveau A1 veut créer une carte où on fera deviner le mot « banane ».

- Nous estimons qu’il doit être guidé par le programme pour introduire les bons mots interdits.

- Plutôt que d’être orienté vers des dictionnaires, le programme affichera une liste de mots

selon leur ordre d’importance que le créateur de carte devra choisir.

o Cet ordre sera déterminé selon des critères de fréquence et en fonctions des liens

sémantiques les plus utilisés.

- De cette manière, l’apprenant ne fera pas de contre sens et pourra également engranger du

vocabulaire et progresser de cette manière également sans être perdu dans la polysémie.

Nous devrons nous diriger vers ce scénario qui peut être possible grâce au TAL.

VII. Application

A. Stratégie de programmation

1. Définition générale,

Nous devrons prévoir :

- des dictionnaires de références en ligne et un moyen d’y accéder.

- Des manuels d’utilisation pour la création des cartes avec des copies d’écran annotées dans

la langue de l’apprenant pour lui faciliter la tâche.

2. Les différentes possibilités

Pour programmer la génération automatique de cartes différentes possibilités s’offrent à nous :

- Créer une base de données qui reliera des thèmes (pays, voyage, médecine…) à des

dictionnaires spécifiques

Page 14: Enrichissement de la base de game of words

Apprentissage des langues

14

o wikipédia, disponible en plusieurs langues, est essentiellement une encyclopédie qui

peut fournir des indications sur les thèmes abordés

o lexilogos est une plate-forme qui réunit différents dictionnaires

thématiques (commercial, informatique, maritime, médecine, nature,

philosophie et sport)

de langues

- Utiliser des robots qui récupéreront les bonnes informations pour incrémenter notre base de

données.

- Créer une fonction spécifique à notre programme qui, à partir du thème choisi, analysera les

ressources lexicales en ligne, et permettra de faire les bonnes propositions.

Il existe d’autres solutions à envisager. Les choix seront fait en fonctions des besoins, des

compétences et de l’existant qui peut être soit à récupérer en l’état, soit à améliorer et à adapter à

notre système de traitement.

3. Notre choix

Pour notre programme nous nous concentrerons sur la partie le plus automatisée de notre

application, c’est-à-dire la génération des cartes pour les niveaux A1 et A2. Le but est, quand il tape

un mot à faire deviner, de lancer un robot qui ira récupérer sur le site www.jeuxdemots.org/diko.php

une liste de termes associés.

Pour la mise en place des instructions à donner à notre « robot », nous déterminerons, de manière

générale, les termes à proposer en priorité en tenant compte de différents paramètres :

- Les objectifs des enseignants qui proposeront à leurs étudiants de créer des cartes

o Est-ce qu’ils veulent travailler sur les relations sémantiques (synonymes,

hyperonymes…) ? Dans ce cas-là, il faudra orienter sur ses types de termes

o Est-ce qu’ils veulent travailler sur des thèmes ? Dans ce cas, il faudra orienter vers les

termes associés.

- La dimension culturelle

o Nous n’avons pas tous les mêmes références culturelles.

Dans l’exemple du chien, nous trouvons dans les termes associés « Milou »,

si cela peut paraître évident pour un français, est-ce que cela le sera pour un

apprenant de langue étrangère ?

Est-ce que voir ses propositions de mots peut lui faire développer des

stratégies avec ses propres références ? (Bethoveen…)

- Les mots dérivés du mot à faire deviner

o Ils ne doivent pas apparaître dans la lites des mots tabous, puisque par essence, ils

sont interdits.

o On pourra régler ceci, en partie, par une expression régulière

Page 15: Enrichissement de la base de game of words

Apprentissage des langues

15

Dans tous les cas, le plus judicieux est d’utiliser l’outil statistique du « diko » pour éviter à l’apprenant

de se retrouver avec des mots dont il n’aura que rarement l’utilité comme « anatidaephobie8 ». Peut-

être, dans les évolutions futures, pourrons-nous envisager un lexique associés aux mots proposés

pour la génération de cartes.

Avant d’aller plus loin dans la programmation, nous devons nous poser quelques questions qui

dérivent les unes des autres.

4. Qu’est-ce qu’une bonne carte tabou ?

Afin de déterminer comment construire notre crawler, nous devons déterminer ce qui forme une

bonne carte tabou.

Elle est composée de :

• 1 mot à faire deviner : nous devrons nous poser la question du doublon. Peut-on faire

deviner le même mot deux fois ?

• Le refuser pour les niveaux A1 et A2

• Solution à explorer pour les autres niveaux

• Entre 1 et 6 mots interdits selon le niveau.

• La carte devra être générée automatiquement avec 6 mots

5. Qu’est-ce qu’un bon mot interdit ?

• Il est différent du mot à trouver

• Ce n’est pas un mot dérivé du mot interdit (ils le sont automatiquement)

• C’est un mot qui devrait nous venir facilement à l’esprit pour nous obliger à chercher

d’autres manières de faire deviner le mot et développer des stratégies de communication.

6. Qu’est-ce qu’un mot qui nous vient facilement à l’esprit ?

• Il a une relation particulière avec le mot à faire deviner (association d’idée, synonyme,

antonyme…)

• Une forte fréquence d’apparition.

• Il est en relation avec le milieu de l’apprenant.

Pour déterminer quel type de relation privilégier, nous avons mené une petite enquête auprès de 3

personnes d’âges et de catégories sociaux professionnelles différentes(CSP). Nous leur avons donné

10 mots. Pour chaque mot, elles ont dû nous donner les 10 premiers qui leur venaient à l’esprit.

Selon, leur âge, CSP ou culture, elles nous ont énumérés des termes plus ou moins spécifiques.

8 Gary Larson est un auteur de dessins humoristiques et de bande dessinée américain, né le 14 ...

L'anatidaephobie, maladie de son invention, est « la peur que quelque part, d'une façon ou d'une

autre, un canard (un anatidé) vous observe. (source wikipédia)

Page 16: Enrichissement de la base de game of words

Apprentissage des langues

16

a) Constat général

total asso d'idée total autres relation

chien 73% 27%

Grenoble 55% 27%

chaise 55% 36%

gâteau 46% 54%

ordinateur 38% 62%

shampoing 80% 20%

sport 70% 30%

permis 95% 5%

café 64% 36%

nez 38% 62%

moyenne des réponses 61% 36%

b) Constat plus spécifique

(1) Moyenne des résultats

Enquêté 1 Enquêté 2 Enquêté 3

Age 31 70 23

CSP Animatrice périscolaire Puéricultrice retraitée Etudiant étranger

Niveau de français Langue maternelle Langue maternelle Langue étrangère

Relation sémantique

prédominante

56% association

d’idées

55% association

d’idées

70% association

d’idées

(2) Moyenne par mot

asso autre asso autre asso autre

chien 63% 38% 89% 11% 60% 40%

grenoble 50% 30% 80% 20% 60% 40%

chaise 50% 50% 25% 75% 100% 0%

gateau 40% 60% 33% 67% 80% 20%

ordinateur 15% 85% 50% 50% 64% 36%

shampoing 75% 25% 100% 0% 67% 40%

sport 73% 27% 0% 0% 60% 40%

permis 100% 0% 67% 33% 100% 0%

café 55% 45% 75% 25% 70% 30%

nez 38% 62% 33% 67% 40% 60%

moyenne des

réponses 56% 42% 55% 35% 70% 31%

Page 17: Enrichissement de la base de game of words

Apprentissage des langues

17

Nous pouvons constater que les résultats varient en fonction du milieu lequel évolue la personne et

son âge d’un mot à l’autre. Nous avons choisi de nous référer au score des étudiants étrangers,

public qui nous intéresse.

7. Questions supplémentaires à se poser :

La hiérarchisation des mots proposés :

• Est-ce qu’on les place du plus fort au moins fort ?

• Est-ce qu’on les place de manière aléatoire ?

Est-ce qu’on accepte les verbes conjugués ? Cette question conduit aux problèmes des ambiguïtés.

Certains participes passés et présents peuvent être également des adjectifs.

Doit-on renvoyer vers un dictionnaire en ligne pour expliquer les mots proposés ?

Comment pouvons-nous intégrer un correcteur orthographique ?

B. L’algorithme idéale envisagée pour un apprenant A1-A2 L’apprenant valide son mot via un formulaire. Il sera stocké dans une variable.

Nous initialisons un compteur de mots Tabous à 0. Il nous permettra de stocker dans un tableau les

mots tabous.

Ensuite nous l’envoyons vers l’url en format XML de diko9 que nous allons parcourir en effectuant le

tri suivant :

- Classement selon la fréquence d’utilisation par ordre décroissant.

- Suppression des lignes n’ayant aucun rapport avec les relations sémantiques

- Suppression des mots dérivés

Nous faisons une boucle qui lira ligne par ligne et qui s’arrêtera quand nous aurons proposé 10 mots :

- Les mots seront donnés selon si

o Il y a une association d’idée et une autre relation

o Une seule association d’idées

o Il n’y a pas d’association d’idées.

- Le chargement ne fonctionnera pas s’il y a moins de 10 mots.

Une fois ce formulaire de choix créé, l’utilisateur devra en sélectionner 6. Si tout est correct, la carte

sera validée.

9 http://www.jeuxdemots.org/rezo-xml.php?gotermsubmit=Chercher&gotermrel=

Page 18: Enrichissement de la base de game of words

Apprentissage des langues

18

VIII. Conclusion : Bilan sur notre réalisation et perspectives

A. Notre réalisation Avant de réaliser notre programme, nous avons pris le temps d’étudier ce qui avait été élaboré

antérieurement, afin de bien comprendre comment se réalise le système et éventuellement

l’améliorer. Nous avons finalement opté pour la création d’un nouveau crawler plus simple que nous

pourrons faire évoluer au fur et à mesure, d’autant plus que nous n’avions pas accès à la base de

données du jeu.

Nous avons privilégiés un premier robot très restrictif par rapport à notre projet initial. La seule

action possible de l’utilisateur sera de proposer un mot à faire deviner.

Seules les relations sémantiques type associations d’idées sont prises en compte pour le moment. Le

poids des mots semble automatiquement trié, dans le dictionnaire, comme nous pouvons le voir

dans le diko. Cependant, certains mots sont refusés car il y a moins de 10 mots dans les relations

sémantiques. Il n’est pas nécessaire de se préoccuper de supprimer les lignes puisque le fait

d’imposer une relation sémantique dans la condition de sélection nettoie naturellement le fichier. Il

nous manque la base de données à créer et incrémenter. Il s’agit d’une base que nous allons pouvoir

faire évoluer.

B. Perspectives Les prochaines étapes seront de :

- Proposer l’assemblage association d’idée et autre relation sémantique, ainsi que la possibilité

de prendre toutes les relations sémantiques quand le nombre d’associations d’idées est

insuffisant.

- Prévoir une expression régulière pour qu’il n’y ait pas de dérivé

o Du mot à faire deviner

o Des mots tabous

- Faire évoluer le crawler et le formulaire d’arriver pour pouvoir proposer une liste de mots

plutôt que d’imposer 6 mots d’offices.

- Proposer des solutions pour les apprenants de niveau supérieurs à A2.

o Il s’agira d’utiliser les hypothèses proposées plus haut.

Page 19: Enrichissement de la base de game of words

Apprentissage des langues

19

Références

!Apprendre l’anglais:Cours d’anglais,jeux,exercices,grammaire,tests-Enseigner

l’anglais. (s. d.). Consulté 2 janvier 2017, à l’adresse http://www.anglaisfacile.com/

Cadre Européen Commun de Reférence. (s. d.). Consulté à l’adresse

http://www.coe.int/t/dg4/linguistic/Source/Framework_FR.pdf

Cours 3 : sémantique lexicale - coursWordnet.pdf. (s. d.). Consulté à l’adresse http://www-

lipn.univ-paris13.fr/~gayral/CoursMaster/coursWordnet.pdf

Editions Didier - exercices autocorrectifs de FLE - Accord niveau 1 - Dossier 4 - Unité 3.

(s. d.). Consulté 2 janvier 2017, à l’adresse

http://www.didieraccord.com/exercices/index.php?ex=4.3.5

Hitchings, H. (s. d.). What’s the language of the future? Consulté 1 janvier 2017, à

l’adresse http://www.salon.com/2011/11/06/whats_the_language_of_the_future/

Lafourcade, L., Mathieu. (s. d.-a). Diko : Consulté 1 janvier 2017, à l’adresse

http://jeuxdemots.org/diko.php

Lafourcade, L., Mathieu. (s. d.-b). JeuxDeMots : accueil. Consulté 1 janvier 2017, à

l’adresse http://www.jeuxdemots.org/jdm-accueil.php

Lafourcade, L., Mathieu. (s. d.-c). Le Rézo sous forme XML. Consulté 2 janvier 2017, à

l’adresse http://www.jeuxdemots.org/rezo-

xml.php?gotermsubmit=Chercher&gotermrel=

Le Conjugueur | Bescherelle. (s. d.). Consulté 2 janvier 2017, à l’adresse

http://bescherelle.com/le-conjugueur-bescherelle

Le présent – exercices - Lingolia Français. (s. d.). Consulté 2 janvier 2017, à l’adresse

https://francais.lingolia.com/fr/grammaire/les-temps/le-present/exercices

Masperi, M., & Quintin, J.-J. (2014). Enseigner à l’université en France, à l’ère du

numérique : l’apport de dispositifs innovants dans la forma­tion en langues.

Page 20: Enrichissement de la base de game of words

Apprentissage des langues

20

Consulté à l’adresse

https://www.researchgate.net/publication/271852910_Enseigner_a_l’universite_en_Fr

ance_a_l’ere_du_numerique_l’apport_de_dispositifs_innovants_dans_la_forma-

tion_en_langues

Projet Voltaire. (s. d.). Consulté 2 janvier 2017, à l’adresse http://www.projet-voltaire.fr/

Game of words. (s. d.). Consulté 1 janvier 2017, à l’adresse

http://gamer.innovalangues.net/gameofwords/

WordNet Search - 3.1. (s. d.). Consulté 1 janvier 2017, à l’adresse

http://wordnetweb.princeton.edu/perl/webwn