Transformation des données et comparaison de modèles pour la classification des données RNA-seq - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Communication Dans Un Congrès Année : 2015

Transformation des données et comparaison de modèles pour la classification des données RNA-seq

Résumé

Les données d'expression issues du séquençage haut-débit (RNA-seq) sont des données de comptage très hétérogènes. Il est naturel de les représenter par des modèles basés sur des lois discrètes comme la loi de Poisson ou la loi binomiale négative. Mais des transformations simples des données peuvent permettre de se ramener à des modèles plus répandus fondés sur des lois gaussiennes. Nous montrons comment comparer objectivement les vraisemblances de ces modèles travaillant sur des données différentes. Nous nous focalisons pour mener ces comparaisons sur des problèmes de classification où les mélanges de Poisson et gaussiens peuvent etre mis en compétition.
High-throughput transcriptome sequencing data (RNA-seq) are made up of highly heterogeneous counts. Although they are often modeled with discrete distributions, including the Poisson and negative binomial distributions, Gaussian models on transformed data could alternatively be considered. We show how the likelihood of these different models can be objectively compared. We focus attention on the problem of clustering gene profiles, where Poisson mixtures on count data are compared with Gaussian mixtures on transformed data.
Fichier principal
Vignette du fichier
submission_165.pdf (121.45 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01200672 , version 1 (22-09-2015)

Identifiants

  • HAL Id : hal-01200672 , version 1
  • PRODINRA : 325881

Citer

Mélina Gallopin, Andrea Rau, Gilles Celeux, Florence Jaffrezic. Transformation des données et comparaison de modèles pour la classification des données RNA-seq. 47èmes Journées de Statistique de la SFdS, Société Française de Statistique (SFdS). FRA., Jun 2015, Lille, France. ⟨hal-01200672⟩
509 Consultations
243 Téléchargements

Partager

Gmail Facebook X LinkedIn More