Apport de la technologie Oxford NanoPore pour l’assemblage de novo du génome d’espèces non-modèles : le cas de la coccinelle asiatique Harmonia axyridis
Résumé
La technologie de séquençage long fragments d'Oxford NanoPore (ONT) est basée sur le séquençage des acides nucléiques via le passage de molécules uniques au travers de nano pores protéiques et permet l’obtention de séquences de plusieurs dizaines de kilobases. Elle a très récemment connu une phase exponentielle de développement et son champ d'application s’est élargi à de nombreux domaines de la génomique et notamment l’assemblage de génome de novo. La coccinelle H. axyridis originaire d'Asie, a été introduite pour être utilisée comme agent de lutte biologique mais a établi des populations invasives en Amérique, en Europe et Afrique du Sud. H. axyridis est devenue une espèce modèle pour l’exploration du déterminisme génétique des caractères impliqués dans le succès invasif de certaines populations. D’autre part, avec plus de 200 morphes de couleur d'élytres contrôlés par un seul locus multi-alléliques, H. axyridis est également une espèce emblématique pour l’étude du déterminisme génétique du polymorphisme de couleur. Néanmoins, mener à bien la caractérisation de l’architecture génétique de ces différents caractères d’intérêt nécessite de disposer de ressources génomiques riches et notamment d’assemblages de génome de bonne qualité (la taille haploïde du génome de H. axyrridis étant estimée à 400 Mb). Suite aux résultats relativement décevants en termes de qualité d’assemblage obtenus à partir de données Illumina classiques (séquençage de banques en PE et MP), nous avons généré des séquences longues issues de la technologie ONT (4 flowcells MinIon, 65X, GeT-PlaGe, INRA-Genotoul, France). Un assemblage de novo a été réalisé en combinant ces longs reads ONT avec des reads courts d’Illumina. Plus précisément, le pipeline d'assemblage comprenait une correction des reads initiaux avec le programme bioinformatique Canu suivi d’un assemblage avec SMARTdenovo. L’assemblage ainsi généré présentant un taux riche en délétions d'homopolymères, une étape de polissage a été réalisée avec des lectures Illumina (banques PE et MP). In fine, la contiguïté de notre assemblage est 200 fois supérieure à notre assemblage initial. La moitié du génome obtenu est contenue dans des séquences génomiques de plus de 1,4 Mb avec une complétude évaluée par l’alignement de gènes orthologues conservés (BUSCO) de plus de 95.5%. Enfin, un contig de 1.3Mb nous a permis une résolution moléculaire fine d’une région du génome de 200 kb caractérisée par un grand nombre de SNPs signant des variations moléculaires importantes spécifiques des différents morphes de couleur d’H. axyridis. L’utilisation de la technologie ONT pour l’assemblage de novo de notre espèce non-modèle s’est ainsi révélée d’un excellent rapport qualité/prix.