TREMoLo-Tweets corpus : guide d'annotation pour un corpus annoté en registres de langue pour le français - Université Paris Lumières Access content directly
Preprints, Working Papers, ... Year : 2021

TREMoLo-Tweets corpus : guide d'annotation pour un corpus annoté en registres de langue pour le français

Abstract

This work is part of the TREMoLo project dedicated to language registers (casual, neutral, and formal). Here, we present an annotation guide grounded on a linguistic analysis of language registers and Computer-Mediated Communications (CMCs). It gives instructions for annotating French tweets according to the tripartition casual, neutral, and formal. First, it specifies and defines the elements specific to CMCs. Then, it presents the protocol for annotating tweets in language registers. All annotation choices have to be justified by at least one linguistic descriptor. The complete list of linguistic descriptors is presented with examples at the end of the annotation guide.
Fichier principal
Vignette du fichier
Guide_d_annotation_pour_un_corpus_annote_en_registres_de_langue_francais.pdf (3.58 Mo) Télécharger le fichier
Origin : Files produced by the author(s)

Dates and versions

hal-03218217 , version 1 (05-05-2021)
hal-03218217 , version 2 (02-09-2021)
hal-03218217 , version 3 (02-09-2021)
hal-03218217 , version 4 (03-09-2021)
hal-03218217 , version 5 (16-09-2021)

Identifiers

  • HAL Id : hal-03218217 , version 5

Cite

Jade Mekki, Delphine Battistelli, Gwénolé Lecorvé, Nicolas Béchet. TREMoLo-Tweets corpus : guide d'annotation pour un corpus annoté en registres de langue pour le français. 2021. ⟨hal-03218217v5⟩
344 View
286 Download

Share

Gmail Facebook X LinkedIn More