Domestiquer de nouvelles espèces de poissons grâce au text mining et à ISTEX - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Domestiquer de nouvelles espèces de poissons grâce au text mining et à ISTEX

Résumé

La présentation débutera par l’explicitation de la finalité sur le long terme du projet qui reste centrale : découvrir de nouvelles espèces de poissons à domestiquer au moyen des technologies de l’information scientifique et technique et plus particulièrement grâce au text mining et au corpus ISTEX. L’objectif plus immédiat du projet est ainsi de peupler une base de données relative aux caractères des espèces de poissons, en partenariat avec le consortium Fishbase, en ayant recours à des technologies de text mining. L’objectif de cette base de données sera ensuite de décrire le portrait robot de l’espèce domesticable et le portrait robot de l’espèce dont la domestication demeure impossible. Ce résultat permettra de mieux connaître le phénomène de la domestication des poissons (recherche fondamentale). Il permettra aussi d’identifier les espèces de poissons sauvages (30 000 espèces) qui ressemblent le plus à ces espèces de poissons d’aquaculture (une centaine d’espèces) afin de pouvoir en expérimenter la domestication (recherche appliquée). La présentation du projet mettra en avant une comparaison entre la démarche suivie il y a plus de dix ans à la bibliothèque d’ichtyologie du Muséum national d’Histoire naturelle avec documents imprimés, photocopieur, stabylo et fichier Excel avec les outils de text mining actuellement utilisés afin de développer nos vocabulaires d’annotation. De la même manière, une comparaison entre nos négociations éditeur par éditeur sera effectuée avec l’API ISTEX actuellement utilisée. ISTEX nous a, en effet, permis de dépasser des obstacles aussi bien juridiques que techniques. Ces comparaisons permettront, en outre, de mieux redonner du sens et de caractériser l’utilité concrète des technologies text mining. Elles aboutiront ensuite à un focus sur les technologies actuellement en cours de mobilisation autour des outils de text mining afin d’annoter des corpus de documents et de développer des vocabulaires à partir de corpus de textes. Au delà de l’annotation d’un corpus ISTEX avec ces vocabulaires, le recours à du crowdsourcing est également envisagé afin de convertir des données annotées par les outils en données interprétées et validées par le cerveau humain et ainsi, “parcourir les derniers kilomètres” qui nous sépareront encore de la connaissance. L’analyse des données collectées et leur mise à disposition sous la forme d’un wiki sémantique, qui reste en grande partie encore à produire, sera également évoquées. Enfin, les perspectives de partenariats avec le Muséum national d’Histoire naturelle et le consortium Fishbase seront abordées ainsi que les opportunités de financements qui ont été et restent encore à rechercher (appels à projets ANR, Interprofession, ISTEX, France AgriMer).
Fichier principal
Vignette du fichier
02FEE6CE-BB83-4E70-985D-BA128D437A57_1 (1.09 Mo) Télécharger le fichier
Domestiquer de nouvelles espèces de poissons grâce au text mining_2 (1.54 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-02801740 , version 1 (05-06-2020)

Identifiants

  • HAL Id : hal-02801740 , version 1
  • PRODINRA : 354613

Citer

Mathieu Andro, Sophie Aubin. Domestiquer de nouvelles espèces de poissons grâce au text mining et à ISTEX. DATA 4IST : exploration et analyse des sources IST pour la recherche et ses environnements, May 2016, Paris, France. pp.14 slides. ⟨hal-02801740⟩
28 Consultations
18 Téléchargements

Partager

Gmail Facebook X LinkedIn More