XebiConFr15 - Les algorithmes du machine learning

  • View
    1.302

  • Download
    5

  • Category

    Software

Preview:

Citation preview

#XebiConFr@YoannBENOIT@AlbanPhelip

1

Les algorithmes du Machine Learning

#XebiConFr

Data Scientist Data Engineer

Yoann Alban

2

#XebiConFr

➔ Présentation générale et cas d’utilisation➔ Systèmes de recommandation➔ Apprentissage non supervisé➔ Apprentissage supervisé➔ Le Machine Learning dans la vraie vie➔ L’avenir...

Agenda

3

#XebiConFr

Machine Learning

Kézako ?

4

#XebiConFr5

#XebiConFr

“ Le Machine Learning est le champ d'étude qui donne aux ordinateurs la capacité d'apprendre

sans être explicitement programmés ”

-- Arthur Samuel

6

#XebiConFr

Pourquoi ?

Quand ?

Où ?7

#XebiConFr8

#XebiConFr9

Les domaines

#XebiConFr

Quelques cas d’utilisation

10

#XebiConFr11

Connaissance client

#XebiConFr12

Segmentation client

Segmentation usages web

Connaissance client

Élaboration de scores

Satisfaction client

#XebiConFr13

Connaissance du marché

#XebiConFr14

Analyse de tendance

Connaissance du marché

Analyse des réseaux sociaux

Analyse de sentiments

Détection de communauté

#XebiConFr15

Optimisation Marketing

#XebiConFr16

Optimisation Marketing

Attribution Allocation

#XebiConFr17

Analyse personnalisée

#XebiConFr18

Analyse personnalisée

Targeting & Retargeting

Recommandations Campagnes promotionnelles

#XebiConFr19

Détection

#XebiConFr20

Détection

Fraude Anomalies

Pannes Personnes / Objets

#XebiConFr21

Prédiction

#XebiConFr22

Prédiction

VentesTrafic

Consommation

#XebiConFr

Les grandes familles d’algorithmes

23

#XebiConFr24

Beaucoup d’algorithmesRegroupés en grandes familles

#XebiConFr25

Beaucoup d’algorithmesRegroupés en grandes familles

#XebiConFr26

#XebiConFr

Systèmes de Recommandation

27

#XebiConFr

Recommandations Non Personnalisées

28

#XebiConFr

Recommandations Personnalisées

29

#XebiConFr

Recommandations Personnalisées

30

#XebiConFr

Recommandations Personnalisées

31

#XebiConFr32

Recommandations Personnalisées

#XebiConFr33

Recommandations Personnalisées

#XebiConFr34

Recommandations Personnalisées

#XebiConFr35

Recommandations Personnalisées

#XebiConFr

Recommandations Personnalisées

36

#XebiConFr

Recommandations Personnalisées

37

#XebiConFr

Recommandations Personnalisées

38

#XebiConFr

Recommandations Personnalisées

39

#XebiConFr

Filtrage Collaboratif

40

Comment générer les recommandations ?

#XebiConFr

Filtrage Collaboratif

41

User Factors

Item Factors

Comment générer les recommandations ?

#XebiConFr

Filtrage Collaboratif

42

User Factors

Item Factors

Comment générer les recommandations ?

#XebiConFr

Filtrage Collaboratif

43

User Factors

Item Factors

Comment générer les recommandations ?

#XebiConFr44

Recommandations Personnalisées

#XebiConFr45

Recommandations Personnalisées

#XebiConFr46

Beaucoup d’algorithmesRegroupés en grandes familles

#XebiConFr

Apprentissagenon supervisé

47

#XebiConFr48

#XebiConFr

Les nouveaux forfaits PaperPlane™ arrivent !

49

#XebiConFr

Nom Conso data Conso appel

Dupont 0,85 Go 1h09

Dupond 12,56 Go 7h25

Tournesol 4,56 Go 2h35

... ... ...

Consommation moyenne par mois

50

#XebiConFr

Représentation graphique

51

#XebiConFr

Clustering

52

#XebiConFr

Clustering

53

#XebiConFr

Clustering

54

#XebiConFr

Clustering

55

#XebiConFr

Clustering

56

#XebiConFr

Clustering

57

#XebiConFr

Clustering

58

#XebiConFr

Clustering

59

#XebiConFr

Clustering

60

#XebiConFr

Centroïdes Data Appel

Rouge 1,56 Go 1h07

Bleu 4,01 Go 3h04

Vert 8,02 Go 3h59

Centroïdes

61

#XebiConFr

Nom Data Appel

A320 2 Go 1h

Boeing 747 4 Go 3h

A380 8 Go Illimité

Les forfaits PaperPlane™

62

#XebiConFr

Apprentissage non superviséDémarche globale

63

#XebiConFr64

Beaucoup d’algorithmesRegroupés en grandes familles

#XebiConFr

ApprentissageSupervisé

Régression

65

#XebiConFr66

#XebiConFr

Prix des forfaits en fonction de l’âge

Nom Age Prix forfait

Dupont 24 ans 22 €

Dupond 43 ans 28 €

Tournesol 56 ans 42 €

... ... ...

67

#XebiConFr

Prix des forfaits en fonction de l’âge

68

#XebiConFr

Prix des forfaits en fonction de l’âge

69

Under-Fitting

#XebiConFr

Prix des forfaits en fonction de l’âge

70

Over-Fitting

#XebiConFr

Prix des forfaits en fonction de l’âge

71

Just Right

#XebiConFr

Prédiction pour un nouveau client

72

#XebiConFr

Prédiction pour un nouveau client

73

#XebiConFr

ApprentissageSupervisé

Classification

74

#XebiConFr75

#XebiConFr

Les clients vont-ils changer de forfait avec la nouvelle offre ?

Nom Ratio Go consommés / disponibles Changement ?

Dupont 0.4 Non

Dupond 1.2 Oui

Tournesol 0.6 Non

... ... ...

76

#XebiConFr

Changement de forfait

77

#XebiConFr

Changement de forfait

78

#XebiConFr

Changement de forfait

79

#XebiConFr

Prédiction pour un nouveau client

80

#XebiConFr

Prédiction pour un nouveau client

81

#XebiConFr

Les clients vont-ils changer de forfait avec la nouvelle offre ?

Nom Ratio Go consommés / disponibles Changement ?

Dupont 0.4 Non

Dupond 1.2 Oui

Tournesol 0.6 Non

Hadock 0.1 Oui

... ... ...

82

#XebiConFr

Autre organisation des données

83

#XebiConFr

Apprentissage de règles

84

Oui

#XebiConFr

Apprentissage de règles

85

OuiNon

< 0.7 > 0.7

#XebiConFr

Apprentissage de règles

86

Oui

< 0.7 > 0.7

< 0.2

NonOui

> 0.2

#XebiConFr

Prédiction pour un nouveau client

87

Oui

< 0.7 > 0.7

< 0.2

NonOui

> 0.2

Ratio actuel: 0.45

#XebiConFr

Prédiction pour un nouveau client

88

Oui

< 0.7 > 0.7

< 0.2

NonOui

> 0.2

Ratio actuel: 0.45

#XebiConFr

Prédiction pour un nouveau client

89

Oui

< 0.7 > 0.7

< 0.2

NonOui

> 0.2

Ratio actuel: 0.45

#XebiConFr

Méthodes d’ensemble90

#XebiConFr

➔ Objectif : Créer plusieurs arbres et rassembler les prédictions pour prendre une décision finale plus stable

Random Forest

91

#XebiConFr

➔ Principe◆ Sélection aléatoire d’un

sous-ensemble de données◆ Sélection aléatoire d’un

sous-ensemble de features➔ Moins interprétable mais gain

en stabilité et robustesse

Random Forest

92

#XebiConFr

Apprentissage superviséDémarche globale

93

#XebiConFr94

Beaucoup d’algorithmesRegroupés en grandes familles

#XebiConFr

Tout ça c’est bien beau...

95

#XebiConFr96

#XebiConFr

Texte brutAberrations

Format

Encoding...

Données manquantes

97

#XebiConFr

Le Feature Engineering

98

#XebiConFr

Nettoyer

99

#XebiConFr

Construire

100

#XebiConFr

Expérimenter

101

#XebiConFr

Les Technologies

102

#XebiConFr

Avoir les bons outils

103

#XebiConFr104

Les outils

#XebiConFr105

Les outils

#XebiConFr

Mise en production

106

#XebiConFr107

#XebiConFr

You need a team!

108

#XebiConFr109

#XebiConFr110

#XebiConFr

Les nouvelles applications

111

#XebiConFr

Le Deep Learning

112

#XebiConFr113

#XebiConFr114

#XebiConFr

Merci

115

Recommended