Vos pouces pour la science

title Vos pouces pour la science
subtitle Corpus de messages belges et français issus de 43 comptes Facebook
creator(s) Louise-Amélie Cougnon
research center(s) Centre de traitement automatique du langage
Media Innovation & Intelligibility Lab
short description Corpus de messages Facebook provenant de publications et de messagerie instantanée. Les messages proviennent de France et de Belgique.
description Le corpus est consituté, d'une part, de messages de messagerie instantanée et, d'autre part, de messages de publications de comptes Facebook. 43 personnes ont envoyé l'intégralité de leurs échanges. Pour le chat, le corpus est consistué de plus de 2 millions de messages (cela correspond à 22 millions de mots) échangés entre 11000 personnes liées aux 43 comptes. Pour les publications, le corpus est constitué de 35000 publications. Il existe aussi un tout petit corpus What'sapp de plus de 70000 lignes (= 1 million de mots) échangés par 33 comptes.
type(s) written
language(s) French
format(s) Comma-Seperated Values (.csv), Text file (.txt)
corpus size 22 millions de mots
date 2018
keywords Facebook, publications, messagerie instantanée, Whatsapp
contributor(s) Rachel Panckhurst
distribution format(s) fichiers
description languages French
contact Louise-Amélie Cougnon <louise-amelie.cougnon@uclouvain.be>
corpus reference

Louise-Amélie Cougnon and Hugues Draelants (2018). « Language Ideologies and Writing Systems in CMC: a Sociolinguistic Approach ». In Louise-Amélie Cougnon, Barbara De Cock and Cédrick Fairon (eds). Language and the new (instant) media, Cahiers du Cental 9, pp. 88-99.