20
AGOHRA et BPP : génération de ressources linguistiques dans le domaine de l’e-recrutement Rémy Kessler Séminaire École des Mines d’Alès 14 décembre 2017

AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

AGOHRA et BPP : génération de ressources linguistiques dans le

domaine de l’e-recrutementRémy Kessler

Séminaire École des Mines d’Alès 14 décembre 2017

Page 2: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

2

Contexte du projet BPP➢ Objectif : le projet BPP1 a pour but d'améliorer l'appariement entre des candidats

et des offres d’emploi en étudiant comment les développements récents du web peuvent aider à résoudre ces problématiques.

➢ Rédaction d’une demande de financement CRSNG de 3 ans en collaboration avec la société Littlebigjob

➢ Projet en plusieurs volets :

• Baromètre de l'emploiMaster Recherche : Abdessamad Outerqiss

• Visualisation des parcours Chercheur : Fabrizio Gotti

• Appariement Master Recherche : Dieng Mamadou Alimou

• Génération d’une ontologie du domaine(1) : Butterfly Predictive project

Page 3: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

AGOHRA Automatic Generation of an Ontology for Human Resource

Applications

Page 4: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

4

Ressources➢Données sources issues du Web :

• 10 millions de profils de réseaux sociaux

• 400 000 offres d’emplois

➢ Utilisation de la modélisation ESCO1

➢ 3 niveaux :

univers

fonction

compétences

(1) https://ec.europa.eu/esco/home

business planning

Financial analyst

Web developer

financial analysis

financial reporting

mysqlHTMLPHP

Banque, finance, capital risque, fonds privés

Digital, e-commerce, big data, jeux électronique

Page 5: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

5

Statistiques sur les profils

Canada France

Nombre de profils 2 658 467 7 484 311

Moyenne du nombre d’expériences 3.2 2.3

Moyenne du nombre de formations 1.39 1.06

Moyenne du nombre de compétences 0.17 0.12

statistiques textuelles des profils

Profil vide 9.61% 16.34%

Moins de 100 caractères 26.95% 40.53%

Moins de 300 caractères 16.18% 12.70%

Moins de 500 caractères 6.43% 4.66%

Plus de 500 caractères 40.83% 25.77%

Page 6: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

6

Une ressource supplémentaire : 48 univers

http://www-etud.iro.umontreal.ca/~gottif/lbj/Ressources-BPP-Univers.htm

Page 7: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

7

L'objectif

Offres d’emploi

Financial analyst

Web developer

financial analysis

financial reporting

Banque, finance, capital risque, fonds privés

Digital, e-commerce, big data, jeux électronique

mysqlHTMLPHP

Agorha*

* Automatic Generation of an Ontology for Human Resource Applications

univers

Page 8: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

8

Offres d’emploi

Financial analyst

Recherche des compétences

Extraction des fonctions

génération de l’ontologie

Financial analyst

● financial reporting● financial analysis● business planning● ....

attribution d’univers

10. Business professionals

Normalisation des offres d’emplois

Financial analyst

Web developer

financial analysis

financial reporting

Banque, finance, capital risque, fonds privés

Digital, e-commerce, big data, jeux électronique

mysqlHTMLPHP

Recherche de Soft Skill

Base de profilsValidation

RegroupementSynonymeDictionnaire de

soft skill

Architecture du système Agohra

Page 9: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

9

Quelques problèmes… et quelques solutions...

Page 10: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

10

Séparer Soft Skill / Hard Skill➢ Définition : 

➢ Hard skills : il s'agit de compétences formellement démontrables, nées d’un apprentissage technique, souvent d’ordre académique, et dont la preuve est apportée par l’obtention de notes, diplômes, certificats.

• Ex : Java, comptabilité, planification

➢ Soft skill : les soft skills sont vos compétences personnelles et sociales, orientées vers les interactions humaines.

● Ex : oral communication skills, travail en équipe, capacité adaptation

Constitution d’un dictionnaire sans filtrage par métier

Offres d’emploi

Recherche de soft skills

Normalisation

Dictionnaire de soft skill

Extraction des fonctions

validation

Page 11: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

11

Validation des compétences➢ Constitution d'un dictionnaire « dynamique » pour chaque métier

– Utilisation de l’indexation Lucene des profils

– Requête “customisé” qui retourne 10 000 profils avec compétences pour

chaque métier

 

requête : “Financial Analyst”

Index LuceneFinancial analysis 153

Financial reporting 141Variance analysis 101Business planning 95Strategic planning 83....

On construit un dictionnaire contenant les compétences les plus fréquentes pour ce métier

Page 12: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

12

D'autres améliorations...➢ Normalisation des fonctions et utilisation d’un arbre préfixe

Ex :

 

➢ Regroupement de compétences synonymes

Ex : good communication skills ↔ strong communication skills

Détection d'un plus grand nombre

de fonctions

assistant assisant assisante assisatnte assisitante

assisstant assisstante assist assistanat assistance

assistante assistation assisted assistent assisteur

assisting assitance assitant assitante asistant asistante

asistente asssistante asssitante

Page 13: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

13

Évaluation

anglais francais

uni. bi. tri. uni. bi. tri.

N-grammes total 60 60 60 60 60 6

N-grammes pertinents 42 51 58 34 51 6

Précision* 0.7 0.85 0.96 0.56 0.85 1

➢ Évaluation manuelle en termes de précision pour 2 métiers :

analyste financier et analyste programmeur 

➢ 0.79 sur l'ensemble de l'évaluation

* N'ayant pas de liste de compétences pour les métiers, nous n'avons pas calculé le rappel

Page 14: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

14

Quelques applications de ces travaux...

Page 15: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

15

Navigation dans l'ontologie

Statistiques

48 univers

391 métiers

3699 Hard Skill

215 Soft Skill

triplets rdf :

➢ Anglais : 46 708

➢ Français : 89 713

Page 16: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

16

Baromètre de l'emploi

➢ Méthodologie :

● Utilisation des offres d’emplois et de l’ontologie afin de savoir qui recrute, où et dans quel domaine

● Composantes d’une offre :

nom de la compagnie, sa localisation géographique, la date de publication, les compétences requises ainsi que le salaire

● Difficultés : salaire, compétences

● Vidéo de démonstration :

https://youtu.be/imsW5aEF3wk

Page 17: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

17

➢ Méthodologie :

● Utiliser les profils de réseaux sociaux afin de définir des parcours professionnels

● Modélisation et construction d’une base de parcours professionnels

● Pour un poste donné, on effectue un alignement des parcours

● Difficultés : variation typographiques des fonctions, sociétés

● Vidéo de démonstration :

https://youtu.be/b2Vl1uFUqpA

Parcours professionnels comptable

comptable

comptable

comptable

comptable

comptable

Page 18: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

18

➢ AGORHA : permets de générer de façon semi-automatique des ressources linguistiques pour l'e-recrutement en français et en anglais

➢ Utilisation d'offres d'emploi afin de détecter le profil minimal pour chaque fonction

➢ Diverses améliorations (dictionnaire dynamique, synonyme, normalisation)

➢ Développement d'un navigateur spécialisé afin d'explorer l'ontologie ainsi que d’autres applications (baromètre et parcours professionnels)

➢ Utiliser le système en complément d’un processus classique de sélection des candidats actifs afin de rechercher les candidats passifs

Conclusion & Perspectives

Page 19: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

« 43% des recruteurs avouent recourir à des recherches de type nom/prénom sur  les  candidats  qui  postulent  chez  eux  et  8%  des  recruteurs  interrogés déclarent  avoir  écarté  un  candidat  à  cause  de  traces  jugées  négatives trouvées  en  ligne. Les  candidats doivent ainsi  faire attention à  leur  identité numérique et réputation. »

RegionsJob (2011)

19

Conseil

Page 20: AGOHRA et BPP : génération de ressources linguistiques dans le …urtado/Slides/Kessler_14_12_2017.pdf · de 3 ans en collaboration avec la société Littlebigjob Projet en plusieurs

20