SMS pour la science

title SMS pour la science
subtitle Corpus de 30.000 SMS et logiciel de consultation
creator(s) Jean-René Klein, Cédrick Fairon, Sébastien Paumier
research center(s) Cental
short description En quelques années, la communication par SMS est passée du rang de simple procédé technique au rang de véritable phénomène de société. Intrigués, les sociologues, psychologues, linguistes et autres spécialistes des langues ou de la communication se penchent donc depuis peu sur ces nouvelles pratiques de communication, souvent située dans le cadre plus large de la communication médiée par ordinateur.
description SMS pour la science (licence : 1 utilisateur, manuel+CD-Rom)
Corpus de 30.000 SMS et logiciel de consultation
Jean René Klein, Sébastien Paumier, Cédrick Fairon

Presses universitaires de Louvain • Cahiers du CENTAL
Livre broché + CD-Rom - 181,50 €

En quelques années, la communication par SMS est passée du rang de simple procédé technique au rang de véritable phénomène de société. Intrigués, les sociologues, psychologues, linguistes et autres spécialistes des langues ou de la communication se penchent donc depuis peu sur ces nouvelles pratiques de communication, souvent située dans le cadre plus large de la communication médiée par ordinateur. Quand il est question de la langue, du "langage SMS", les chercheurs mettent en avant la difficulté d'obtenir des données authentiques sur lesquelles faire reposer leurs études. Le premier objectif du corpus SMS pour la science est de répondre à cette attente en mettant à la disposition de la communauté scientifique un large corpus de SMS collectés dans un cadre expérimental contrôlé.

Le corpus diffusé sur ce CD-ROM est l’un des plus grands corpus de SMS existant à l’heure actuelle. Il compte 30.000 SMS rassemblés en Belgique francophone dans le cadre du projet “Faites don de vos SMS à la science” sous l’égide de deux centres de recherche de l’Université catholique de Louvain : le Centre de traitement automatique du langage (CENTAL) et le Centre d’études sur les lexiques romans (CELEXROM).

Deux particularités font de cette base de données une ressource exceptionnelle :

TRANSCRIPTIONS : tous les messages ont été transcrits dans un français “normalisé”. Le logiciel d’interrogation permet de faire des recherches dans le texte standardisé et d’afficher les SMS originaux qui contiennent des variantes graphiques du mot recherché.

PROFILS SOCIOLINGUISTIQUES : près de 90% des 2436 auteurs dont les messages sont rassemblés dans ce corpus ont répondu à un questionnaire sociolinguistique et à des questions portant sur leur pratique du SMS. Ces informations sont disponibles dans l’interface de consultation et peuvent également servir de critères de recherche.
type(s) written
language(s) French
format(s) text
date 2006
keywords SMS
corpus publisher(s) Presses universitaires de Louvain
distribution format(s) Livre + cédérom
description languages French
contact Cédrick Fairon <cedrick.fairon@uclouvain.be>