| title | sms4science |
| subtitle | Corpus international de SMS pour la recherche scientifique |
| creator(s) | Louise-Amélie Cougnon, Cédrick Fairon, Rachel Panckhurst, Elisabeth Stark, Patrick Drouin, Gudrun Ledegen, Christian Guilbault |
| research center(s) | Centre de traitement automatique du langage |
| short description | Corpus de SMS collecté entre 2004 et 2012. Il contient des messages en français, anglais, allemand et italien. |
| description | Corpus de SMS collecté entre 2004 et 2012. Il contient des messages en français, anglais, allemand et italien. Le corpus est issu de la collaboration de plusieurs zones géographiques : la Belgique, la Suisse, l'île de La Réunion, Montpellier et le Canada. Le corpus est constitué de 150,000 SMS. |
| type(s) | written |
| language(s) | French, English, Italian, German |
| format(s) | Comma-Seperated Values (.csv) |
| corpus size | 150 000 SMS |
| date | 2012 |
| keywords | sms, profils |
| corpus publisher(s) | Une partie est publiée aux Presses universitaires de Louvain |
| contributor(s) | Rachel Panckhurst |
| distribution format(s) | fichiers |
| description languages | French |
| contact | Louise-Amélie Cougnon <louise-amelie.cougnon@uclouvain.be> |
| corpus reference | Fairon C., Klein J. et Paumier S. (2006), « Le Corpus SMS pour la science. Base de données de 30.000 SMS et logiciels de consultation », CD-Rom, Presses universitaires de Louvain, Louvain-la-Neuve. Cahiers du Cental, 3.2. ISBN : 2-87463-028-4 Cougnon L.-A. (2015), « Langage et SMS. Une étude internationale des pratiques actuelles », Presses universitaires de Louvain, Louvain-la-Neuve. Cahiers du Cental, 8.1. ISBN: 978-2-87463-371-0 |