faites don de vos SMS à la science! ;-)


/
  Un corpus de 30.000 SMS en français disponible sur CD-ROM
Aux Presses Universitaires de Louvain
[ LE CORPUS ]



Fairon C., Klein J. et Paumier S. (2006), « Le Corpus SMS pour la science. Base de données de 30.000 SMS et logiciels de consultation », CD-Rom, Presses universitaires de Louvain, Louvain-la-Neuve. Cahiers du Cental, 3.2.


© Presses universitaires de Louvain, 2006
Dépôt légal : D/2006/9964/18
ISBN : 2-87463-028-4
- Commander LE CORPUS sur i6doc.com:
>>> www.i6doc.com/doc/smscd

- Télécharger un extrait du corpus et la version d'évaluation du CD-ROM

En quelques années, la communication par SMS est passée du rang de simple procédé technique au rang de véritable phénomène de société. Intrigués, les sociologues, psychologues, linguistes et autres spécialistes des langues ou de la communication se penchent donc depuis peu sur ces nouvelles pratiques de communication, souvent située dans le cadre plus large de la communication médiée par ordinateur. Quand il est question de la langue, du langage SMS, les chercheurs mettent en avant la difficulté dobtenir des données authentiques sur lesquelles faire reposer leurs études. Le premier objectif du corpus SMS pour la science est de répondre à cette attente en mettant à la disposition de la communauté scientifique un large corpus de SMS collectés dans un cadre expérimental contrôlé.

Le corpus diffusé sur ce CD-ROM est lun des plus grands corpus de SMS existant à lheure actuelle. Il compte 30.000 SMS rassemblés en Belgique francophone dans le cadre du projet Faites don de vos SMS à la science sous légide de deux centres de recherche de lUniversité catholique de Louvain : le Centre de traitement automatique du langage (CENTAL) et le Centre détudes sur les lexiques romans (CELEXROM).

Deux particularités font de cette base de données une ressource exceptionnelle :
  • TRANSCRIPTIONS : tous les messages ont été transcrits dans un français normalisé. Le logiciel dinterrogation permet de faire des recherches dans le texte standardisé et dafficher les SMS originaux qui contiennent des variantes graphiques du mot recherché.
  • PROFILS SOCIOLINGUISTIQUES : près de 90% des 2436 auteurs dont les messages sont rassemblés dans ce corpus ont répondu à un questionnaire sociolinguistique et à des questions portant sur leur pratique du SMS. Ces informations sont disponibles dans linterface de consultation et peuvent également servir de critères de recherche.
Plus d'infos:
  • C. Fairon, S. Paumier (2006). "A translated corpus of 30,000 French SMS". In Proceedings of LREC 2006. Genova.
  • C. Fairon, J.R. Klein, S. Paumier (2006). "Le langage SMS : révélateur d1compétence". In J.-J. Didier, O. Hambursin, Ph. Moreau, M. Seron (éds). "Le français m'a tuer". Actes du colloque Lorthographe française à lépreuve du supérieur. Presses universitaires de Louvain, Louvain-la-Neuve (Cahiers du Cental 1): 33-42. [Commander sur i6doc.com]
Contact: Cédrick Fairon: fairon@tedm.ucl.ac.be
[ LE LIVRE ]



Fairon C., Klein J. et Paumier S. (2006), « Le langage SMS. Etude d'un corpus informatisé à partir de l'enquête 'Faites don de vos SMS à la science' », Presses universitaires de Louvain, Louvain-la-Neuve. Cahiers du Cental, 3.1. 136p.
© Presses universitaires de Louvain, 2006
Dépôt légal : D/2006/9964/38
ISBN : 2-87463-048-9

Commander LE LIVRE sur i6doc.com:
>>> www.i6doc.com/doc/sms

L'ouvrage

Pour la première fois, une étude scientifique propose une vision du « langage SMS ». Refusant de se fier aux intuitions ou aux impressions, les auteurs de cette étude linguistique attentive, basée sur un corpus de données authentiques, bousculent les idées reçues. La brièveté des messages est-elle une règle ? Tout le monde utilise-t-il les mêmes abréviations ? Ces jeux de langue sont-ils nouveaux ? Est-ce un langage de jeunes ? Est-ce la ruine de l'orthographe française ?

Le projet « Faites don de vos SMS à la science » a permis de rassembler 75 000 SMS dans une base de données qui constitue aujourd'hui la plus vaste source d'information accessible pour la recherche. Ce livre entraîne le lecteur dans les coulisses de ce projet scientifique avant de lui faire découvrir les trésors d'inventivité linguistique dont font preuve les usagers du SMS.

Le public

Amateur de SMS, simple usager ou spécialiste de la langue... ce livre s'adresse à toute personne intéressée par le langage SMS ou par les méthodes d'investigation utilisées pour étudier la langue. Accessible au grand public, mais sans concession sur la rigueur scientifique, cet ouvrage répondra également aux attentes des étudiants ou des chercheurs qui y trouveront détails techniques et données chiffrées présentant la plus grande base de données linguistiques destinées à l'étude du langage SMS.

Les auteurs

Les auteurs sont linguistes et informaticiens. Ils s'intéressent au langage, à son évolution et à l'influence des technologies de l'information et de la communication.

Cédrick Fairon est chargé de cours à l'Université catholique de Louvain et directeur du Centre de traitement automatique du langage (Cental). Linguiste et informaticien, il est spécialisé dans la description linguistique des langues en vue de leur traitement informatique.

Jean Klein est professeur ordinaire à l'Université catholique de Louvain et directeur du Centre d'études des lexiques romans (Celexrom). Linguiste spécialisé dans l'étude du lexique, il s'intéresse particulièrement à la créativité lexicale et au langage des jeunes.

Sébastien Paumier est maître de conférences à l'Université de Marne-la-Vallée, spécialiste de la linguistique informatique, il est le concepteur d'un logiciel destiné à l'analyse des textes par ordinateur.





[Home] - [UCL] - [CENTAL]
Dernière mise à jour le 23/09/06. Responsable : Cédrick Fairon.