Méthodologie pour identifier les terrains d'étude dans des corpus scientifiques - CIRAD - Centre de coopération internationale en recherche agronomique pour le développement Accéder directement au contenu
Article Dans Une Revue Document numérique - Revue des sciences et technologies de l'information. Série Document numérique Année : 2017

Methodology for identifying study sites in scientific corpus

Méthodologie pour identifier les terrains d'étude dans des corpus scientifiques

Résumé

The TERRE-ISTEX project aims at identifying the evolution of research working relation to study areas, disciplinary crossings and concrete research methods based on the heterogeneous digital content available in scientific corpora. The project is divided into three main actions: (1) to identify the periods and places which have been the subject of empirical studies, and which reflect the publications resulting from the corpus analyzed, (2) to identify the thematics addressed in these works and (3) to develop a web-based geographical information retrieval tool (GIR). The first two actions involve approaches combining Natural languages processing patterns with text mining methods. By crossing the three dimensions (spatial, thematic and temporal) in a GIR engine, it will be possible to understand what research has been carried out on which territories and at what time. In the project, the experiments are carried out on a heterogeneous corpus including electronic thesis and scientific articles from the ISTEX digital libraries and the CIRAD research center.
Le projet interdisciplinaire TERRE-ISTEX a pour objectif d'identifier l'évolution des fronts de recherche en relation avec les territoires d'études, les croisements disciplinaires ainsi que les modalités concrètes de recherche à partir des contenus numériques hétérogènes disponibles dans les corpus scientifiques. Le projet se décompose en trois actions principales~: (1) identifier les périodes et les lieux qui ont fait l'objet d'études empiriques et dont rendent compte les publications issues des corpus analysés, (2) identifier les thématiques traitées dans le cadre de ces études et enfin (3) développer un démonstrateur Web de recherche d'information géographique (RIG). Les deux premières actions font intervenir des approches combinant des patrons du traitement automatique du langage naturel à des méthodes de fouille de textes. En croisant les trois dimensions (spatial, thématique et temporel) dans un moteur de RIG, il sera ainsi possible de comprendre quelles recherches ont été menées sur quels territoires et à quel moment. Dans le cadre du projet, les expérimentations sont menées sur un corpus hétérogène constitué de thèses électroniques et d'articles scientifiques provenant des bibliothèques numériques d'ISTEX et du centre de recherche CIRAD.
Fichier principal
Vignette du fichier
KergosienAl_DocNumerique2017-perso.pdf (1002.19 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01856066 , version 1 (09-08-2018)
hal-01856066 , version 2 (11-08-2018)

Licence

Copyright (Tous droits réservés)

Identifiants

Citer

Eric Kergosien, Marie-Noelle Bessagnet, Maguelonne Teisseire, Joachim Schöpfel, Mohammad Amin Farvardin, et al.. Méthodologie pour identifier les terrains d'étude dans des corpus scientifiques. Document numérique - Revue des sciences et technologies de l'information. Série Document numérique, 2017, 20 (2-3), pp.11-30. ⟨10.3166/dn.2017.00011⟩. ⟨hal-01856066v2⟩
1632 Consultations
898 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More