18
SEO & FOUILLE DE TEXTES L’extraction d’information

Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Embed Size (px)

DESCRIPTION

Les applications des technologies de web mining pour le SEO

Citation preview

Page 1: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

SEO & FOUILLE DE TEXTESL’extraction d’information

Page 2: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Extraction d’information

• « Information extraction  »– Reconnaissance d’entités nommées– Identification des coréférences

(ONU=Organisation des Nations Unies)– Extraction de relations– Extraction d’évènements– Extraction de terminologies…

Page 3: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Reconnaissance des entités nommées

• La reconnaissance d'entités nommées est une sous-tâche de l'activité d'extraction d'information dans des documents

• Elle consiste à rechercher des objets textuels (c'est-à-dire un mot, ou un groupe de mots) catégorisables dans des classes telles que noms de personnes, noms d'organisations ou d'entreprises, noms de lieux, quantités, distances, valeurs, dates, etc.

Page 4: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Exemple : OpenCalais (Reuters)

Page 5: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Autre exemple

• Dbpedia Spotlight

Page 6: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Annotation automatique

Page 7: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Extraction d’évènements

Page 8: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Extraction de faits et de relations

Page 9: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Structuration de données non structurées

Page 10: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Revminer

Page 11: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Catégorisation automatique

Page 12: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

« Normalisation » des coréférences

• The Beatles• Beatles• Beatle• Beatles (The)• The Beatles (Group)

Page 13: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Génération de textes automatique

Page 14: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Génération de pages hubs

Page 15: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Maillage automatique

Page 16: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Analyse du sentiment

Page 17: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Conclusion

Page 18: Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

Merci !