“Non-standard texts: from theoretical positions to Natural Language Processing normalisation”.

Abstract : Our digital resource of 88,000 anonymised French text messages, the 88milSMS corpus, and sociolinguistic questionnaire data, are available (http://88milsms.huma-num.fr). Our theoretical position and Natural Language Processing (NLP) investigation techniques, including mediated discourse analysis on SMS-writing, ‘unknown’ item classification, alignment and normalisation methods, are envisaged for future implementation in real-life applications.
Type de document :
Poster
PLIN-Day, May 2016, Louvain-la-Neuve, Belgium. 2016
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01487025
Contributeur : Rachel Panckhurst <>
Soumis le : vendredi 10 mars 2017 - 17:37:51
Dernière modification le : vendredi 9 juin 2017 - 10:42:18

Fichier

lopez-roche-panckhurst-plin-po...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01487025, version 1

Citation

Cédric Lopez, Mathieu Roche, Rachel Panckhurst. “Non-standard texts: from theoretical positions to Natural Language Processing normalisation”.. PLIN-Day, May 2016, Louvain-la-Neuve, Belgium. 2016. <hal-01487025>

Partager

Métriques

Consultations de
la notice

189

Téléchargements du document

74