13
Projet ImagiWeb BLEND 2013 – Julien Velcin Université Lyon 2

Project ImagiWeb @BLEND2013

Embed Size (px)

Citation preview

Projet  ImagiWeb  

BLEND  2013  –  Julien  Velcin  Université  Lyon  2  

•  Projet  financé  par  l’ANR  (2012-­‐2015)  et  soutenu  par  les  pôles  de  compéMMvité  

•  ObjecMf  du  projet  :  analyser  la  dynamique  de  l’image  (représentaMon)  d’une  enMté  sur  Internet  

•  Points  forts  :  – Analyse  jointe  des  opinions  et  des  individus  –  ImplicaMon  de  chercheurs  en  SHS  

2  

hVp://mediamining.univ-­‐lyon2.fr/people/velcin/imagiweb  

PrésentaMon  générale  

Partenaires  du  projet  éditeur  de  logiciel  pour  la  veille    sociologues  spécialistes  sciences  poliMques    uMlisateurs,  étude  sémiologique    data  mining,  apprenMssage  automaMque    fouille  de  textes  et  d’opinion,  recherche  d’informaMon    TAL,  extracMon  d’informaMon  

porteur  

3  

4  

!"#$%&'

("$)*"+,$)&'

)-.'/')"$*)0*1&)&2'

3455)&'0461#7,)&'

(5+8)'

%51&)'

(5+8)'

0)*9,)'

(5+8)'

0)*9,)'

(5+8)'

0)*9,)'

:455)"$+1*)&'

;%<1+&'<)'

=455,"1=+#4"'>&1$)&'?)@2'06+7,)A)2')$=.B'

C"+6D&)'<)&'<4""%)&'

<E)-0*)&&14"'

C"+6D&)'<)&'

040,6+#4"&'

F))<@+=G' (;CH(I!J'

%5)A),*&'

%5)A),*&'

*%=)0$),

*&'

*%=)0$),*&'

*%=)0$),*&'

Schéma  général  

AVribut  

Bilan  

Compétence  

Ethique  InjoncMon  

Performance  

Personne  

PosiMonnement  

Projet  

Image  :  exemple  de  l’homme  poliMque  

5  

AcquisiMon  des  données  

•  Trois  sources  iniMalement  prévues  :  – Blogs  (~1500  sites  sur  la  poliMque)  – TwiVer  – Facebook  

•  Le  ciblage  des  données  :  – Requêtes  formulées  en  accord  entre  AMI  soeware  et  le  partenaire  uMlisateur  (CEPEL  et  EDF)  

– EchanMllonnage  aléatoire  sur  chaque  mois  de  la  période  concernée  pour  l’annotaMon  

6  

•  ApplicaMon  Web  pour  annoter  tweets  et  blogs  

7  

Plate-­‐forme  d’annotaMon  

(Sarkozy,  -­‐  )              

(Sarkozy,  bilan,  -­‐-­‐  )              

(Sarkozy,  communicaMon,  +  )              

(Sarkozy,  compétence,  +  )              

8  

Sor'e  :  ensemble  de  marqueurs  d’opinion    =  tuples  (enMté,  date,  auteur,  message,  cible,  polarité)  

 

Plate-­‐forme  d’annotaMon  

           Cibles        Iden'fiant   Polarité  

«  …ce  que  Sarkozy  n’a  pas  fait  en  5  ans…  »  

Quelques  staMsMques  

•  7273  tweets  annotés  pour  le  cas  d’étude  des  hommes  poliMques  (54%  pour  N.  Sarkozy  et  46%  pour  F.  Hollande)  

•  ~50%  ont  été  annotés  au  moins  deux  fois  •  En  appliquant  certaines  règles  de  compaMbilité,  17  à  19%  de  désaccord  sur  l’opinion  et  32%  sur  la  cible  

•  53%  de  tweets  plutôt  négaMfs  contre  18%  posiMfs  •  Les  cibles  les  plus  visées  :  en'té  (opinion  générale)  23%,  posi'onnement  13%,  éthique  11%  

9  

10  

11  

•  Entrée  :  ensemble  des  tuples  (enMté,  date,  auteur…)  •  Comment  suivre,  afficher,  interroger  ces  images  ?  

12  

InjoncMon  EnMté  AVribut  

ConstrucMon  et  suivi  des  images  

ParMcipaMon  d’ERIC  au  projet  •  Management  général  du  projet  (J.  Velcin)  •  Suivi  des  images  d’enMté  dans  le  temps  (post-­‐doc  de  

Young-­‐Min  Kim,  co-­‐dirigé  avec  S.  Bonnevay)  •  Emergence  de  nouvelles  cibles  de  l’opinion  (post-­‐doc  de  

Marian-­‐Andréi  Rizoiu,  co-­‐dirigé  avec  S.  Bonnevay)  •  ExtracMon  jointe  des  thémaMques  et  des  opinions  

(thèse  CIFRE  de  Mohamed  Dermouche,  co-­‐dirigé    avec  S.  Loudcher  et  L.  Khouas  -­‐AMI  Soeware-­‐)  

•  Diffusion  de  l’informaMon  dans  les  réseaux  sociaux  (thèse  d’Adrien  Guille,  dirigé  par  D.A.  Zighed  et  C.  Favre)  

•  Méthodes  hybrides  pour  la  classificaMon  des  opinions  (stage  de  Pavel  Soriano,  dirigé  par  J.  Ah-­‐Pine)  

13