Prédiction markovienne in silico des régions constantes et variables des lentivirus - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Thèse Année : 2006

In silico markovian prediction of variable and constant regions of lentivirus genomes

Prédiction markovienne in silico des régions constantes et variables des lentivirus

Aurélia Quillon
  • Fonction : Auteur
  • PersonId : 837558

Résumé

Lentiviruses exhibit a considerable plasticity of the env gene, particularly in the region which encodes the surface (SU) glycoprotein. Interestingly, the SU mutations are clustered in restricted areas, called variable (V) regions and interspaced by more stable regions, called constant regions (C). To determine if the C and V regions are characterized by specific signatures, we developed HMM (Hidden Markov Models), based on the statistical oligonuclotide composition of each type of region, aimed at differentiating the C and V regions of the lentiviruses. We trained hidden Markov models on SU sequences of the equine, human, simian and small ruminant lentiviruses. We obtained a clear delimitation of the C and V regions of all these lentiviruses and of bovine and feline lentiviruses which were not used to define the models. Our results suggest that the C and V regions of the lentiviruses have statistical differences in their composition in words of nucleotides or amino-acids. Specific signatures of the C and V regions have been extracted from our models.
Les lentivirus présentent une évolution rapide du gène env, notamment dans la région codant la glycoprotéine de surface (SU). Un fait remarquable est que les mutations de la SU sont localisées dans des zones spécifiques, appelées régions variables (V), séparées par des régions dites constantes (C). Afin de déterminer s'il existe des signatures spécifiques des régions C et V, nous avons développé des modèles de Markov cachés, ou HMM (Hidden Markov Models), basés sur la composition en oligonucléotides de chaque type de région, capables de différencier les régions C et V des lentivirus. Nous avons entraîné des modèles de Markov cachés sur des séquences des SU des lentivirus équins, humains, simiens et des petits ruminants. Nous avons obtenu une délimitation claire des régions C et V de tous ces lentivirus ainsi que des lentivirus bovins et félins qui n'avaient pas été utilisés pour définir les modèles. Nos résultats suggèrent que les régions C et V des lentivirus ont des compositions statistiques en mots de nucléotides et d'acides aminés différentes. Des signatures caractéristiques des régions C et V ont été extraites à partir des modèles définis.
Fichier principal
Vignette du fichier
these_BoissinQuillon.pdf (2.01 Mo) Télécharger le fichier
these.ppt (809 Ko) Télécharger le fichier
Format : Autre
Loading...

Dates et versions

tel-00124142 , version 1 (12-01-2007)

Identifiants

  • HAL Id : tel-00124142 , version 1
  • PRODINRA : 252032

Citer

Aurélia Quillon. Prédiction markovienne in silico des régions constantes et variables des lentivirus. Mathématiques [math]. Université Claude Bernard - Lyon I, 2006. Français. ⟨NNT : ⟩. ⟨tel-00124142⟩
214 Consultations
476 Téléchargements

Partager

Gmail Facebook X LinkedIn More