“Non-standard texts: from theoretical positions to Natural Language Processing normalisation”.

Abstract : Our digital resource of 88,000 anonymised French text messages, the 88milSMS corpus, and sociolinguistic questionnaire data, are available (http://88milsms.huma-num.fr). Our theoretical position and Natural Language Processing (NLP) investigation techniques, including mediated discourse analysis on SMS-writing, ‘unknown’ item classification, alignment and normalisation methods, are envisaged for future implementation in real-life applications.
Type de document :
Poster
PLIN-Day, May 2016, Louvain-la-Neuve, Belgium. 2016
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01487025
Contributeur : Rachel Panckhurst <>
Soumis le : vendredi 10 mars 2017 - 17:37:51
Dernière modification le : mardi 10 octobre 2017 - 10:29:32
Document(s) archivé(s) le : dimanche 11 juin 2017 - 17:19:08

Fichier

lopez-roche-panckhurst-plin-po...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01487025, version 1

Citation

Cédric Lopez, Mathieu Roche, Rachel Panckhurst. “Non-standard texts: from theoretical positions to Natural Language Processing normalisation”.. PLIN-Day, May 2016, Louvain-la-Neuve, Belgium. 2016. 〈hal-01487025〉

Partager

Métriques

Consultations de
la notice

230

Téléchargements du document

83