title | sms4science |
subtitle | Corpus international de SMS pour la recherche scientifique |
creator(s) | Louise-Amélie Cougnon, Cédrick Fairon, Rachel Panckhurst, Elisabeth Stark, Patrick Drouin, Gudrun Ledegen, Christian Guilbault |
research center(s) | Centre de traitement automatique du langage |
short description | Corpus de SMS collecté entre 2004 et 2012. Il contient des messages en français, anglais, allemand et italien. |
description | Corpus de SMS collecté entre 2004 et 2012. Il contient des messages en français, anglais, allemand et italien. Le corpus est issu de la collaboration de plusieurs zones géographiques : la Belgique, la Suisse, l'île de La Réunion, Montpellier et le Canada. Le corpus est constitué de 150,000 SMS. |
type(s) | written |
language(s) | French, English, Italian, German |
format(s) | Comma-Seperated Values (.csv) |
corpus size | 150 000 SMS |
date | 2012 |
keywords | sms, profils |
corpus publisher(s) | Une partie est publiée aux Presses universitaires de Louvain |
contributor(s) | Rachel Panckhurst |
distribution format(s) | fichiers |
description languages | French |
contact | Louise-Amélie Cougnon <louise-amelie.cougnon@uclouvain.be> |
corpus reference | Fairon C., Klein J. et Paumier S. (2006), « Le Corpus SMS pour la science. Base de données de 30.000 SMS et logiciels de consultation », CD-Rom, Presses universitaires de Louvain, Louvain-la-Neuve. Cahiers du Cental, 3.2. ISBN : 2-87463-028-4 Cougnon L.-A. (2015), « Langage et SMS. Une étude internationale des pratiques actuelles », Presses universitaires de Louvain, Louvain-la-Neuve. Cahiers du Cental, 8.1. ISBN: 978-2-87463-371-0 |