title | Vos pouces pour la science |
subtitle | Corpus de messages belges et français issus de 43 comptes Facebook |
creator(s) | Louise-Amélie Cougnon |
research center(s) | Centre de traitement automatique du langage Media Innovation & Intelligibility Lab |
short description | Corpus de messages Facebook provenant de publications et de messagerie instantanée. Les messages proviennent de France et de Belgique. |
description | Le corpus est consituté, d'une part, de messages de messagerie instantanée et, d'autre part, de messages de publications de comptes Facebook. 43 personnes ont envoyé l'intégralité de leurs échanges. Pour le chat, le corpus est consistué de plus de 2 millions de messages (cela correspond à 22 millions de mots) échangés entre 11000 personnes liées aux 43 comptes. Pour les publications, le corpus est constitué de 35000 publications. Il existe aussi un tout petit corpus What'sapp de plus de 70000 lignes (= 1 million de mots) échangés par 33 comptes. |
type(s) | written |
language(s) | French |
format(s) | Comma-Seperated Values (.csv), Text file (.txt) |
corpus size | 22 millions de mots |
date | 2018 |
keywords | Facebook, publications, messagerie instantanée, Whatsapp |
contributor(s) | Rachel Panckhurst |
distribution format(s) | fichiers |
description languages | French |
contact | Louise-Amélie Cougnon <louise-amelie.cougnon@uclouvain.be> |
corpus reference | Louise-Amélie Cougnon and Hugues Draelants (2018). « Language Ideologies and Writing Systems in CMC: a Sociolinguistic Approach ». In Louise-Amélie Cougnon, Barbara De Cock and Cédrick Fairon (eds). Language and the new (instant) media, Cahiers du Cental 9, pp. 88-99. |