25
Rachel Panckhurst, CÉNC, 31/5/12 Un nouveau corpus de SMS. La collecte sud4science LR. Rachel Panckhurst Praxiling UMR 5267 CNRS & Université Paul-Valéry Montpellier 3

Un nouveau corpus de SMS. La collecte sud4science LR

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12

Un nouveau corpus de SMS. �La collecte sud4science LR.

Rachel Panckhurst Praxiling UMR 5267 CNRS &

Université Paul-Valéry Montpellier 3

Thierry
Zone de texte
Groupe de travail Nouv-com, IR corpus-écrits, séminaire en ligne du 31 mai 2012
Page 2: Un nouveau corpus de SMS. La collecte sud4science LR
Page 3: Un nouveau corpus de SMS. La collecte sud4science LR

http://www.sud4science.org/ http://www.msh-m.fr/programmes-2011/sud4science-lr/

http://www.alpes4science.org/ http://www.texto4science.ca/ http://www.sms4science.ch/

http://www.lareunion4science.org/

http://www.sms4science.org

93114

22 000   5 000 24 000 12 000

(75 000)

30 000

Page 4: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 4

renseignements aux participants objectifs, participation, protection de la vie privée, confidentialité, envoi des SMS, cadeaux. correspondant informatique et libertés : [email protected]

droit

Page 5: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 5

communication

radio france bleu hérault, sud radio

tf1, france 3

Page 6: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 6

téléphones intelligents

synchronisation ?

logiciel d’extraction

récolte

Page 7: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 7

premiers résultats

508 inscrits 482 consentement & questionnaire 433 donateurs 53 % élèves/étudiants 93 114 sms

Page 8: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 8

participants

11 à 66 ans 24,1 ans en moyenne 71,4 % majeurs 28,6 % mineurs

63 % < 24 ans 80 % < 30 ans

Page 9: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 9

téléphone, usages, études

74 % téléphones intelligents 88 % sms illimités

80 % + de 5 ans d’utilisation 63 % supérieur (≤ bac+3)

Page 10: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 10

sms 93 114 (13 semaines)

433 donateurs 215 messages par personne gagnante ipad : 8 045 en 10 semaines 10 donateurs : 37 133 (40 %) 66,4 caractères avec espaces / SMS 54 caractères sans espaces / SMS 13,45 mots / SMS

Page 11: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 11

Wesh trkl tkt ;) tu fou quoi ?

Oh bah nan ! ce week end c'est bon ! Faut que je fasse des courses d'habits

Ta u <PRE_5> o tel?

As tu u le tps de fer le virment a <PRE_3> ?

J'ai fait quelques recherches : ma table est probablement une table à téléphone ou une table à thé des années 1920 dans un style Louis XIII (ou XVIIe s.) revisité. Il faut savoir que le style Louis XIII était

considéré bucolique aux XIXe et au début du XXe s. Je suis assez catégorique : des éléments architecturaux XVIIe mais aux dimensions

graciles très 1920. Par contre l'origine…

Page 12: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 12

anonymisation Salut s que 2nis c dcd à ht 1 dvd pr sa cop

ki e pa la 2main?

sms brut Salut s que

<NOM_4> c dcd à ht 1 dvd pr sa cop ki

e pa la 2main?

sms anonymisé

Salut est-ce que <NOM_4> s'est

décidé à acheter 1 dvd pour sa copine

qui est pas là demain?

sms transcodé

Salut <MOD_s_que> est-ce que <NOM_4> <MOD_c> s'est <MOD_dcd> décidé à <MOD_ht> acheter 1 <TYP_dvd> DVD

<MOD_pr> pour sa <MOD_cop> copine <MOD_ki> qui <ABS_ne> <MOD_e> est

<MOD_pa> pas <TYP_la> là <MOD_2main> demain <TYP_espace_avant_?_manquante> ?

sms annoté

annotation

Page 13: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 13

« Oh oui ! : contrairement à la visiophonie qui est extrêmement contraignante puisqu'on doit être présentable et qu'on doit tenir la caméra devant soi si on est mobile, contrairement au téléphone où on doit se rappeler qu'on est écouté, l’SMS est follement pratique :- on peut communiquer sans bruit et immédiatement ;- on peut envoyer une question qui a peu d'importance sans ressentir la gêne de déranger l’autre pour si peu et pourtant obtenir rapidement la réponse (« Comment fais-tu ta génoise à l'églantine ?, c'est pour ce soir ! ») ;- on peut envoyer des références (adresse, titre d'œuvre, de film, numéro de téléphone, …) que l’autre pourra lire à sa guise sans avoir a réécouter un message vocal au prix de # # #, etc.- on peut faire coucou à un vieil ami pour lui dire qu'on pense à lui même s'il est loin ou si on ne se voit plus très souvent pour des raisons pratiques sans avoir à gloser sur la famille, les amis, les enfants, la carrière, … ;- on peut avertir plusieurs camarades de classe à la fois qu'une salle a changé ou qu'un professeur est absent (impossible au téléphone, et plus immédiat qu'un courrier électronique) ;- …Toutes ces choses peuvent être faites par courrier électronique mais pas en direct ; elles peuvent être faites au téléphone mais il faut le temps de s'acquitter de formules longues et c'est bruyant et peu discret ; … ; seul l'SMS permet de simplifier l'interaction dans ces situations.Même si tout le monde avait un iPhone connecté à la 3G en permanence, ce qui coûte cher aujourd'hui, tout le monde n'est pas sur Skype, tout le monde n'a pas choisi MSN, alors que l'SMS est un système unique. »

Page 14: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 14

langues pratiquées « à l’aise » fréquence maternelle

LC1 : fre LC2 : eng LC3 : mlg LF1 : fre LM1 : mlg LM2 : fre

sociolinguistique

Page 15: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 15

Écrire ce que l'on n'ose pas dire. Ils sont très pratiques car ils me permettent de faire passer un

message sans déranger la personne. On doit répondre tout de suite (plus ou moins) à un appel alors que nous pouvons répondre aux sms quand

nous voulons.

c'est une bonne façon de communiquer, cela permet d'être rapide et concis. Autre avantage : moi qui ai peu de mémoire, ça me permet de garder les infos (adresses, heure de rdv...)

- : attente de la réponse

C'est moins clair, ça n'encourage pas à éviter les fautes,

ça n’encourage pas à développer les idées.  

L'envoi de sms permet de communiquer quasi instantanément en allant directement au but, contrairement à la conversation

téléphonique qui induit un certain nombre de passages obligés avant d'entamer le sujet réel de conversation.

Page 16: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 16

😜 😝 😄

binettes & objets graphiques

Page 17: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 17

cadre & contenu Pas en abrégé ! Je

t'aime

J'arrête pas de te dire de m'oublier ... Je pense avoir été plus que sincère ... Ne

me reproche pas de profiter de toi !!!

Je t'aime ! J'ai plus de batt donc si je rep pas c'est pas pck j'ai pas envie et de toute facon j'ai piscine a 15h^^

Je suis ds le train, todo bene. Trop bon les fondants au petit dej!

Gracias la madre, bonne semaine

C'e

st m

oi le

pat

ron

Grrr ... On a réussit à changer nos billets ... On a pris le suivant ! On arrivera 1 heure après vous !!! Pffff galère et fou rire !!! Et toi çà va ?!? Dommage qu'on ai

pas voyagé ensemble !!!

Si tu veux je viens te chercher à 6h

Ouiiii je me languis! Tu veux que j'amene quelque chose??

Biiiisoux <3

Hey ca va? Alors cette rentree? Va falloir se trouver un p'tit creneau

pour se voir! Dis moi, est-ce que tu sais quand commence les cours de

langue non specialiste? Bisoux

Bon bah puisque tu répond pas à mes messages et que tu raccroche quand je

t'appel je considère que c'est fini. Comme tu veut pas me dire si oui où

non tu me quitte alors je considère que oui :'( bisous je t'aime.

Page 18: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 18

écriture abrégée ?

Oui grav .c mieu.ta vu ia pa 2raisn 2se fair d film .lol

Oui cme sa i pouron ri1 te reproché. C complet ce soir?

Pwoua tu metone il è bo lapart

Slt j vé alé á la mèri 2m1

Merd javé mem pa vu tn sms de ce matin

Page 19: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 19

taille du message

Demain je suis vraiment obligée d'etre à bibli pour

dejeuner avec des gens oui, on a déjà eu bcp de mal à se

reunir et à se mettre d'accord sur l'endroit donc si je

change je vais me faire empaler. Par contre, après 15h et

jusque 18h et quelques je peux etre un peu n'importe

où, mais je prends mon train à gare de lyon à 18h40... Tu

me dis si ca te va mon bichon, gros poutoux !

Cc

Page 20: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 20

sans espaces

Coucou ma ptit fantomette!j aret pa 2 penser a toi...esper kil est arivè a se calmer è ke ça va.j pens a toi

tt l tps mai ne fai ke traill.,bcp 2 cour a assurer, dè remplacemen 2 collègue abst.je travail ts les soir juska minui.suì fatiguè mai je rèsiste.,le gout citronè davant hier me rèjouit tjrs otan!!!...c est tro bon!tu me mank

tro.bisoutoucalinourienkepourtoipuissance 10<3

"tu rayonnes" et son mari est fière de la photo frontenormeetjouesdehamsterjovial

Page 21: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 21

des sms « isolés »… …aux sms « conversationnels »

Page 22: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 22

conclusion : évolutions

téléphones intelligents forfaits sms illimités appels illimités gratuits vers mobiles modification des usages ou habitudes prises ? pratiques scripturales modifiées en fonction du destinataire pratiques linguistiques

quelles pratiques pour les

néophytes ? « Slt cé saji é Rachel cété pour savoir si vou voulé

alé a la plage cet apreme »

Page 23: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12

105.  F. Coucou L :)) cmt tu vas ? quoi de beau ? Cmt se passe les cours ? Faudra se faire une soirée ! F est la ? Au fait scoop jsui en coupe lol te raknterai ! Dis moi taurai le tel a C ? G a pas sn tel et elle connaît pas sn nim ! Biyoux

106. B. Salut ça va bien. Non je suis seule. Je croyais que vous m’avez oubliée !!! Cool je vois qu’on a des trucs a se raconter !!!! Non j’ai pas le num a C ! Dsl bonne journée, a bientôt ! Bizz 107. F. Lol nan tkt on ta pas oublié c juste quentre les cour et ma nouvelle relation jai pas trop trep de temps lol ^^ et ui c clair on a plein dtruc a se dire lol :)) demain jai pas cours on peut se voir si tu veux :)) […]

23

Page 24: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 24

http://www.sud4science.org

Page 25: Un nouveau corpus de SMS. La collecte sud4science LR

Rachel Panckhurst, CÉNC, 31/5/12 25

Rachel Panckhurst Maître de conférences en linguistique-informatique

Praxiling UMR 5267 CNRS & Université Paul-Valéry Montpellier 3 [email protected]

sud4science@msh-m/org http://www.sud4science.org

http://recherche.univ-montp3.fr/praxiling/spip.php?article20

Claudine Moïse Catherine Détrie Bertrand Verine Mathieu Roche Cédric Lopez