sms4science

title sms4science
subtitle Corpus international de SMS pour la recherche scientifique
creator(s) Louise-Amélie Cougnon, Cédrick Fairon, Rachel Panckhurst, Elisabeth Stark, Patrick Drouin, Gudrun Ledegen, Christian Guilbault
research center(s) Centre de traitement automatique du langage
short description Corpus de SMS collecté entre 2004 et 2012. Il contient des messages en français, anglais, allemand et italien.
description Corpus de SMS collecté entre 2004 et 2012. Il contient des messages en français, anglais, allemand et italien. Le corpus est issu de la collaboration de plusieurs zones géographiques : la Belgique, la Suisse, l'île de La Réunion, Montpellier et le Canada. Le corpus est constitué de 150,000 SMS.
type(s) written
language(s) French, English, Italian, German
format(s) Comma-Seperated Values (.csv)
corpus size 150 000 SMS
date 2012
keywords sms, profils
corpus publisher(s) Une partie est publiée aux Presses universitaires de Louvain
contributor(s) Rachel Panckhurst
distribution format(s) fichiers
description languages French
contact Louise-Amélie Cougnon <louise-amelie.cougnon@uclouvain.be>
corpus reference

Fairon C., Klein J. et Paumier S. (2006), « Le Corpus SMS pour la science. Base de données de 30.000 SMS et logiciels de consultation », CD-Rom, Presses universitaires de Louvain, Louvain-la-Neuve. Cahiers du Cental, 3.2. ISBN : 2-87463-028-4

Cougnon L.-A. (2015), « Langage et SMS. Une étude internationale des pratiques actuelles », Presses universitaires de Louvain, Louvain-la-Neuve. Cahiers du Cental, 8.1. ISBN: 978-2-87463-371-0