FRÉDÉRIC RAYMOND BIO-INFORMATIQUE POUR LA GÉNOMIQUE ET LE DIAGNOSTIC DES MALADI

FRÉDÉRIC RAYMOND BIO-INFORMATIQUE POUR LA GÉNOMIQUE ET LE DIAGNOSTIC DES MALADIES INFECTIEUSES Thèse présentée à la Faculté des études supérieures de l’Université Laval dans le cadre du programme de Doctorat en physiologie-endocrinologie pour l’obtention du grade de Philosophiæ doctor (Ph. D.) DÉPARTEMENT DE BIOLOGIE MÉDICALE FACULTÉ DE MÉDECINE UNIVERSITÉ LAVAL QUÉBEC 2011 © Frédéric Raymond, 2011 Résumé Le séquençage du génome d’un microorganisme est un jalon important dans l’étude de sa biologie. Quel que soit cet organisme, les outils bio-informatiques nécessaires pour comprendre son génome et le comparer aux autres génomes séquencés seront similaires. Dans cette thèse, l’ADN génomique de parasites et de virus est mis à profit afin de mieux comprendre ces microorganismes. Dans un premier temps, le parasite protozoaire Leishmania est étudié par transcriptomique et par génomique comparative afin de mieux comprendre son infectivité, sa résistance aux antiparasitaires et son mode de vie dimorphique. Ce parasite alterne entre le stade flagellé (promastigote) et le stade intracellulaire aflagellé (amastigote). Afin de faciliter l’analyse par biopuces du transcriptome de Leishmania, un système de gestion et d’analyse de données de biopuces a été conçu. Quatre études utilisant ce système sont présentées sommairement et leurs implications sont discutées. Deuxièmement, le génome de l’espèce Leishmania (sauroleishmania) tarentolae, qui n’est pas pathogène pour l’humain, a été séquencé et comparé à trois espèces infectant l’homme. Cette étude a montré que, même si peu de gènes différencient les espèces, L. tarentolae possède moins de gènes associés au stade amastigote que les autres espèces. Deux familles de gènes ont été trouvées en nombre de copies élevées chez L. tarentolae : GP63 et PSA31C. Ces résultats permettent une meilleure compréhension de la biologie de L. tarentolae et de la virulence des autres espèces de Leishmania. Dans un deuxième temps, les séquences des génomes de virus respiratoires disponibles dans les bases de données publiques ont été analysées pour créer un test diagnostique permettant la détection et l’identification de 25 types de virus respiratoires, dont la grippe A (H1N1) responsable de la pandémie de 2009 et la grippe aviaire A (H5N1). Le test a été validé avec des échantillons de laboratoire et avec des échantillons cliniques. Même si l’étude du parasite Leishmania était indépendante de celle des virus respiratoires, les approches utilisées pour ces deux projets étaient similaires. Ainsi, la bio-informatique est un outil essentiel en microbiologie, car elle est indispensable pour résoudre des problèmes de diverses natures chez des organismes différents. ii Abstract Sequencing a genome is a milestone in the study of an organism. Bioinformatics allow both to better understand single organisms and to compare them to related species through comparative genomics. This thesis centers on the idea that genome sequence of parasites and viruses can be used in various ways to better understand these microorganisms. Transcriptomics and comparative genomics were used to study the protozoan parasite Leishmania in order to better understand its virulence, its resistance to antiparasitic drugs, and its dimorphic life-cycle, which includes a flagellated free form named promastigote and an aflagellate intracellular form named amastigote. In order to study gene expression in Leishmania, an integrated management and analysis system was created, along with protocols designed for Leishmania microarrays analysis. Four studies using this system are briefly described. In another study, the genome of Leishmania (sauroleishmania) tarentolae, a lizard parasite, was sequenced and compared to human pathogenic Leishmania species. This study showed little difference between the Leishmania species, although L. tarentolae seems to contain less genes associated to the amastigote life-cycle, including the amastin gene. Two gene families were highly expanded in L. tarentolae: the surface metalloprotease GP63 and the promastigote antigen protein PSA31C. These results provide a better understanding of L. tarentolae biology and give insights on the genes involved in virulence in pathogenic Leishmania species. The second part of this thesis concerns the creation of a molecular diagnostic assay for the detection and identification of 25 respiratory virus types, including the influenza A/H1N1 pandemic strain and the avian influenza A/H5N1 strain. This assay was created by analyzing genome sequences available from public repositories and it was afterwards tested on laboratory and clinical virus strains. Although Leishmania and respiratory viruses are distantly related, the approaches used in both projects were similar. Thus, bioinformatics is an essential and ubiquitous science that allows to solve problems in different areas (―omics‖) of biology. Avant-propos En 1990, la population de la planète est décimée à 99,4 % par un supervirus échappé d’un centre de recherche de l’armée américaine. Ce moment, même s’il est fictif, a fait naître en moi une grande curiosité pour les maladies infectieuses. Depuis ma première lecture du roman Le Fléau, de Stephen King, j’ai su que j’orienterais ma carrière vers la recherche en microbiologie. Au fil des ans, d’autres œuvres de fiction ont modulé mon choix de carrière, notamment les bandes dessinées américaines X-Men, avec leurs constantes références à la génétique. Des projets comme ceux auxquels j’ai eu la chance de participer au cours de mes travaux de doctorat m’ont permis, par leur nature à la pointe des technologies biomédicales, d’étudier les maladies infectieuses d’un point de vue aussi fascinant que celui des docteurs Henry McCoy, Nathaniel Essex et Moïra McTaggert, qui ont habité mon imaginaire depuis que je sais lire. Sans Stephen King et Chris Claremont, j’aurais peut-être choisi une autre voie. De retour à la réalité, je remercie Jacques Corbeil, mon directeur de recherche, qui m’a permis de participer à tous ces projets fascinants et qui, avec son enthousiasme et son esprit visionnaire, m’a dirigé pendant mon doctorat. La liberté qu’il m’a laissée pour mener mes projets m’a permis de m’épanouir pendant mes études de troisième cycle. Merci à Lynda Robitaille, présence indispensable dans le laboratoire, sans qui beaucoup de projets auraient été très compliqués. Merci à Sébastien Boisvert, pour ses talents de bio- informaticien, qui a grandement facilité plusieurs des travaux présentés dans cette thèse. Merci à Nancy Boucher, qui m’a beaucoup aidé dans le laboratoire et qui m’a fait rire. Merci à Jessyka Fortin pour sa connaissance approfondie de la PCR en temps réel. Merci à Mélissa Sirois, pour toutes les discussions. Merci à Éric Madore, pour son humour et ses compétences dans le domaine des biopuces. Merci à Thibault Varin, pour les « fucking lie » et autres musiques tonitruantes. Merci à René Paradis, pour son support informatique et sa connivence musicale. Merci à toute la gang de bio-informatique de l’époque Complan. Merci au bâtiment Complan, pour m’avoir inspiré un roman d’horreur. Merci à Marc Ouellette et à Barbara Papadopoulou, pour leur collaboration et leurs commentaires tout au long des projets décrits dans cette thèse. Merci à Danielle Légaré, iv ressource essentielle en génomique de Leishmania. Merci à Gaétan Roy pour son support dans le projet de séquençage de L. tarentolae. Merci à Jean-Michel Ubeda, pour ces projets fascinants au cours desquels nous avons collaboré, même s’ils ne sont pas tous inclus dans cette thèse. Merci à Annie Rochette, pour sa collaboration dans l’analyse de ses données. Merci aux autres leishmanieux avec qui j’ai eu la chance de travailler. Merci à Guy Boivin et à son équipe, en particulier à Julie Carbonneau et à Marie-Ève Hamelin, pour leur support dans les projets de diagnostic moléculaire d’infections respiratoires virales. Finalement, je remercie mes parents, qui m’ont toujours encouragé et qui m’ont souvent montré la fierté qu’ils ressentaient concernant mon choix de carrière. Merci à Caroline, mon épouse adorée, qui, en plus de m’avoir encouragé tout au long de mes études universitaires, a mis à mon service ses compétences de réviseure linguistique chaque fois que j’en avais besoin, en particulier pour réviser cette thèse. Merci à Lauriane, qui ne m’a pas toujours laissé travailler, mais qui a toujours ensoleillé mes journées par sa petite binette. Merci à la famille et aux amis qui se sont tenus au courant de mes progrès tout au long de mes études. Je remercie les Instituts de recherche en santé du Canada pour le financement de mes études de doctorat. Merci au parasite Leishmania qui m’a montré que tout sujet est intéressant si l’on pose les bonnes questions. v Contributions Cette section présente la description de mes contributions aux différents projets présentés dans cette thèse de doctorat. Le chapitre 4 présente la création d’un système de gestion et d’analyses de données de biopuces utilisées pour l’étude du parasite Leishmania. Au cours de ces travaux, j’ai créé le concept de LMMAP et rédigé les spécifications du logiciel. J’ai ensuite supervisé Sébastien Boisvert dans la programmation du logiciel. J’ai créé les protocoles de normalisation et d’analyse des biopuces Leishmania. Finalement, j’ai conseillé les utilisateurs de la biopuce dans la conception de leurs expériences, fait la normalisation et l’analyse statistiques des données et proposé des analyses supplémentaires pour les articles énumérés dans l’annexe 1. Le chapitre 5 décrit le génome de Leishmania tarentolae. Pour ce projet, j’ai supervisé et validé l’assemblage du génome, j’ai réalisé l’annotation du génome et j’ai effectué les analyses de génomique comparative. Finalement, j’ai fouillé les résultats de génomique comparative afin de trouver les différences uploads/Geographie/ bio-informatique-pour-la-genomique.pdf

  • 10
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager