Non-standard texts: from theoretical positions to Natural Language Processing normalisation - CIRAD - Centre de coopération internationale en recherche agronomique pour le développement Accéder directement au contenu
Poster De Conférence Année : 2016

Non-standard texts: from theoretical positions to Natural Language Processing normalisation

Résumé

Our digital resource of 88,000 anonymised French text messages, the 88milSMS corpus, and sociolinguistic questionnaire data, are available (http://88milsms.huma-num.fr). Our theoretical position and Natural Language Processing (NLP) investigation techniques, including mediated discourse analysis on SMS-writing, ‘unknown’ item classification, alignment and normalisation methods, are envisaged for future implementation in real-life applications.
Fichier principal
Vignette du fichier
lopez-roche-panckhurst-plin-poster-A1.pdf (517.41 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01487025 , version 1 (10-03-2017)

Identifiants

  • HAL Id : hal-01487025 , version 1

Citer

Cédric Lopez, Mathieu Roche, Rachel Panckhurst. Non-standard texts: from theoretical positions to Natural Language Processing normalisation. PLIN-Day, May 2016, Louvain-la-Neuve, Belgium. 2016. ⟨hal-01487025⟩
393 Consultations
65 Téléchargements

Partager

Gmail Facebook X LinkedIn More