Upload
julien-velcin
View
238
Download
0
Embed Size (px)
Citation preview
• Projet financé par l’ANR (2012-‐2015) et soutenu par les pôles de compéMMvité
• ObjecMf du projet : analyser la dynamique de l’image (représentaMon) d’une enMté sur Internet
• Points forts : – Analyse jointe des opinions et des individus – ImplicaMon de chercheurs en SHS
2
hVp://mediamining.univ-‐lyon2.fr/people/velcin/imagiweb
PrésentaMon générale
Partenaires du projet éditeur de logiciel pour la veille sociologues spécialistes sciences poliMques uMlisateurs, étude sémiologique data mining, apprenMssage automaMque fouille de textes et d’opinion, recherche d’informaMon TAL, extracMon d’informaMon
porteur
3
4
!"#$%&'
("$)*"+,$)&'
)-.'/')"$*)0*1&)&2'
3455)&'0461#7,)&'
(5+8)'
%51&)'
(5+8)'
0)*9,)'
(5+8)'
0)*9,)'
(5+8)'
0)*9,)'
:455)"$+1*)&'
;%<1+&'<)'
=455,"1=+#4"'>&1$)&'?)@2'06+7,)A)2')$=.B'
C"+6D&)'<)&'<4""%)&'
<E)-0*)&&14"'
C"+6D&)'<)&'
040,6+#4"&'
F))<@+=G' (;CH(I!J'
%5)A),*&'
%5)A),*&'
*%=)0$),
*&'
*%=)0$),*&'
*%=)0$),*&'
Schéma général
AVribut
Bilan
Compétence
Ethique InjoncMon
Performance
Personne
PosiMonnement
Projet
Image : exemple de l’homme poliMque
5
AcquisiMon des données
• Trois sources iniMalement prévues : – Blogs (~1500 sites sur la poliMque) – TwiVer – Facebook
• Le ciblage des données : – Requêtes formulées en accord entre AMI soeware et le partenaire uMlisateur (CEPEL et EDF)
– EchanMllonnage aléatoire sur chaque mois de la période concernée pour l’annotaMon
6
• ApplicaMon Web pour annoter tweets et blogs
7
Plate-‐forme d’annotaMon
(Sarkozy, -‐ )
(Sarkozy, bilan, -‐-‐ )
(Sarkozy, communicaMon, + )
(Sarkozy, compétence, + )
8
Sor'e : ensemble de marqueurs d’opinion = tuples (enMté, date, auteur, message, cible, polarité)
Plate-‐forme d’annotaMon
Cibles Iden'fiant Polarité
« …ce que Sarkozy n’a pas fait en 5 ans… »
Quelques staMsMques
• 7273 tweets annotés pour le cas d’étude des hommes poliMques (54% pour N. Sarkozy et 46% pour F. Hollande)
• ~50% ont été annotés au moins deux fois • En appliquant certaines règles de compaMbilité, 17 à 19% de désaccord sur l’opinion et 32% sur la cible
• 53% de tweets plutôt négaMfs contre 18% posiMfs • Les cibles les plus visées : en'té (opinion générale) 23%, posi'onnement 13%, éthique 11%
9
• Entrée : ensemble des tuples (enMté, date, auteur…) • Comment suivre, afficher, interroger ces images ?
12
InjoncMon EnMté AVribut
ConstrucMon et suivi des images
ParMcipaMon d’ERIC au projet • Management général du projet (J. Velcin) • Suivi des images d’enMté dans le temps (post-‐doc de
Young-‐Min Kim, co-‐dirigé avec S. Bonnevay) • Emergence de nouvelles cibles de l’opinion (post-‐doc de
Marian-‐Andréi Rizoiu, co-‐dirigé avec S. Bonnevay) • ExtracMon jointe des thémaMques et des opinions
(thèse CIFRE de Mohamed Dermouche, co-‐dirigé avec S. Loudcher et L. Khouas -‐AMI Soeware-‐)
• Diffusion de l’informaMon dans les réseaux sociaux (thèse d’Adrien Guille, dirigé par D.A. Zighed et C. Favre)
• Méthodes hybrides pour la classificaMon des opinions (stage de Pavel Soriano, dirigé par J. Ah-‐Pine)
13