Introduction BI4U2 – Bioinformatique appliquée http://pedagogix-tagc.univ-mrs.f

Introduction BI4U2 – Bioinformatique appliquée http://pedagogix-tagc.univ-mrs.fr/courses/bioinfo_intro/ 1 Jacques van Helden Jacques.van-Helden@univ-amu.fr Aix-Marseille Université, France Technological Advances for Genomics and Clinics (TAGC, INSERM Unit U1090) http://jacques.van-helden.perso.luminy.univ-amu.fr/ Matériel de cours ! Diapos, énoncés des TP " http://pedagogix-tagc.univ-mrs.fr/courses/bioinfo_intro/ ! Dépôt des rapports de TP " http://ametice.univ-amu.fr/course/view.php?id=11052 2 Objectifs pédagogiques ! Ce cours est destiné à des étudiants en sciences de la vie (biologie, biochimie, sciences biomédicales). ! Théorie (10h CM) " Introduction aux concepts et méthodes de base en bioinformatique. " Illustrations sur base d'exemple concrets. ! Pratique (5x4h TP) " Utilisation des outils bioinformatiques pour analyser des séquences biologiques. " Interprétation biologique des résultats " Evaluation de la fiabilité statistique des alignements de séquences ! http://pedagogix-tagc.univ-mrs.fr/courses/bioinfo_intro/ 3 Qu'est-ce que la bioinformatique ? Bioinformatics 4 Quelques définitions de la bioinformatique (1) ! Les bioinformaticiens définissent leur propre domaine de diverses manières ! Georgia Inst of Tech., USA " “Bioinformatics is an integration of mathematical, statistical and computer methods to analyse biological, biochemical and biophysical data” " "Intégration des méthodes mathématiques, statistiques et informatiques pour analyser les données biologiques, biochimiques et biophysiques" ! Cette définition me semble assez pertinente, mais présente la faiblesse d'être motivée par les données plutôt que par les questions. 5 Quelques définitions de la bioinformatique (2) ! Les bioinformaticiens définissent leur propre domaine de diverses manières ! Stanford University, USA " “Bioinformatics is the study of biological information as is passes from its storage site in the genome to the various gene products in the cell. …it involves the creating and development of advanced information and computational technologies for problems in molecular biology…” " "La bioinformatique est l'étude de l'information biologique quand elle passe de son site de stockage dans le génome aux différents produits des gènes dans la cellule. […] Elle inclut la création et le développement de technologies informatiques avancées pour les problèmes de la biologie moléculaire. ! Cette définition me semble trop restrictive. En particulier, "les produits des gènes" réduit le domaine à l'analyse des protéines. La bioinformatique inclut d'autres champs d'application, comme l'étude du métabolisme, des séquences nucléiques, de l'évolution, etc. 1. “Bioinformatics specifically refers to the search and use of patterns and structure in biological data and the development of new methods for database access.” • (Virginia Inst Tech., USA) • No doubt that this definition was written by a computer scientist, or an informatician, but not by a bioinformatician. 6 Quelques définitions de la bioinformatique (3) ! Les bioinformaticiens définissent leur propre domaine de diverses manières ! Virginia Inst Tech., USA " “Bioinformatics specifically refers to the search and use of patterns and structure in biological data and the development of new methods for database access.” " "La bioinformatique se réfère spécifiquement à la recherche et à l'utilisation de patterns et de structures dans les données biologiques et au développement de nouvelles méthodes pour accéder aux bases de données." ! Sans aucun doute, cette définition a été écrite par un informaticien, et non par un biologiste ou un bioinformaticien. 7 Quelques définitions de la bioinformatique (4) ! Certains établissent une distinction entre "bioinformatique" et "biologie computationnelle". ! Pour autant que je sache, les deux termes étaient initialement utilisés indistinctement pour désigner la même discipline. Les tentatives ultérieures de délimiter une frontière entre "bioinformatique" et "biologie computationnelle" me semblent quelque peu arbitraires, et vaines. ! Virginia Inst Tech., USA " "Bioinformatics specifically refers to the search and use of patterns and structure in biological data and the development of new methods for database access. Computational biology is more frequently used to refer to physical and mathematical simulation of biological processes." " "La bioinformatique se réfère spécifiquement à la recherche et à l'utilisation de patterns et de structures dans les données biologiques et au développement de nouvelles méthodes pour accéder aux bases de données. La biologie computationnelle est plus fréquemment utilisée pour se référer aux simulations physiques et mathématiques des processus biologiques." ! Source: Biomedical Information Science and Technology Initiative http://www.bisti.nih.gov/ 8 Quelques définitions de la bioinformatique (5) ! Certains établissent une distinction entre "bioinformatique" et "biologie computationnelle". ! Pour autant que je sache, les deux termes étaient initialement utilisés indistinctement pour désigner la même discipline. Les tentatives ultérieures de délimiter une frontière entre "bioinformatique" et "biologie computationnelle" me semblent quelque peu arbitraires, et vaines. ! National Institute of Health (NIH), USA. Working Definition of Bioinformatics and Computational Biology - July 17, 2000 " "Bioinformatics : Research, development, or application of computational tools and approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data." " "Bioinformatique: recherche, développement ou application d'outils informatiques [computationnels ?] et d'approches pour étendre l'utilisation des données biologique, médicales, comportementales ou sanitaires, y compris [les outils et approches] pour acquérir, entreposer, organiser, archiver, analyser ou visualiser de telles données." " "Computational Biology: The development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems." " "Biologie computationnelle: développement et application de méthodes analytiques et théoriques, de modélisation mathématique et de techniques de simulation informatique [computationnelle ?] pour l'étude de systèmes biologiques, comportementaux et sociaux." ! Source: Biomedical Information Science and Technology Initiative http://www.bisti.nih.gov/ 9 How would I define it ? ! Développement et applications de méthodes informatiques, statistiques, mathématiques et physiques pour l’analyse de données biomoléculaires. ! Development and applications of methods from computer sciences, statistics, mathematics and physics to analyse biomolecular data. 10 La bioinformatique – pour quoi faire ? 11 Domaines de la bioinformatique (liste non exhaustive) ! Gestion des données ! Structures moléculaires " Visualisation, analyse, classification, prédiction ! Analyse de séquences " Alignements, recherches de similarités, détection de motifs ! Génomique " Annotation des génomes, génomique comparative ! Phylogénie " Relations évolutives entre gènes, entre génomes, entre organismes " Inférence de scénarios évolutifs ! Génomique fonctionnelle " Transcriptome, protéome, interactome ! Analyse des réseaux biomoléculaires " Réseaux métaboliques, d’interactions protéiques, de régulation génétique, … ! Biologie des systèmes " Modélisation et simulation des propriétés dynamiques des systèmes biologiques ! … 12 Analyse des génomes ! http://www.ensembl.org/Homo_sapiens/Location/Chromosome?r=20:31817450-31917450 13 ! Exemple: vue schématique du chromosome humain numéro 22 (source: Ensembl). ! La bioinformatique est utilisée à chaque étape d'un projet de séquençage génomique. " Stockage des séquences primaires " Assemblage des séquences chromosomiques " Prédiction de la localisation des gènes " Annotation des gènes (prédiction de leur fonction sur base de leur séquence, recherches bibliographiques). " Analyse de la composition chromosomique (contenu en GC, variations interindividuelles, …). " … Analyse du transcriptome ! Figure source: Den Boer et al. A subtype of childhood acute lymphoblastic leukaemia with poor treatment outcome: a genome-wide classification study. Lancet Oncol (2009) vol. 10 (2) pp. 125-34 14 ! La transcription des gènes est précisément régulée: chaque gène est exprimé à un niveau spécifique en fonction du type cellulaire, du tissu, du temps, des conditions intra- et extra-cellulaires, … ! Depuis 1997, les technologies des biopuces ont été développées pour mesurer les concentrations de tous les ARNs d'une cellule. ! Le transcriptome est défini comme l'ensemble de toutes les molécules d'ARN transcrites à partir d'un génome. ! Depuis 1997, l'analyse du transcriptome a été utilisée pour comprendre les mécanismes de régulation transcriptionnelle, ainsi que pour certaines applications médicales (exemple ci-contre: classification des cancers). ! Figure: classification de leucémies lymphoblastiques aigues en sous-types (lignes) sur base de profils d'expression pour une série de gènes marqueurs (colonnes). Le séquençage à très haut débit (“next generation sequencing (NGS)" ! Figure from: Sboner et al. The real cost of sequencing: higher than you think!. Genome Biol (2011) vol. 12 (8) pp. 125 15 ! Le coût du séquençage a baissé de façon exponentielle depuis les années 1990, grâce à l'amélioration et à l'automatisation des techniques, stimulées par les projets de séquençage de génomes. ! Jusqu'en 2006, cette décroissance était plus ou moins proportionnelle à la décroissance exponentielle des coûts de stockage et d'analyse informatique (loi de Moore). ! Depuis 2007, plusieurs compagnies ont proposé des nouvelles technologies beaucoup plus rapides. Le coût du séquençage decroît beaucoup plus vite que celui du stockage. ! Les biologistes sont confrontés à un réel problème pour stocker et analyser les données qu'ils produisent. Sboner et al. (2011) The real cost of sequencing: higher than you think!. Genome Biol 12: 125 Note: L'ordonnée est logarithmique Le vrai coût des projets de séquençage ! Sboner et al. (2011) The real cost of sequencing: higher than you think!. Genome Biol 12: 125 16 ! La chute des prix du séquençage va de pair avec une augmentation des coûts relatifs d'autres étapes du projet: " Pre-processing: collection et préparation des échantillons. " Post-processing: analyse des données massives générées par les projets. ! Les laboratoires qui se lancent dans le séquençage à haut débit expriment donc un besoin croissant pour l'analyse bioinformatique. Sboner et al. (2011) The real cost of sequencing: higher than you think!. Genome Biol 12: 125 Métagénomique - échantillonnage des génomes ! La métagénomique consiste à séquencer des échantillons uploads/Science et Technologie/ 01-introduction-fr-6ppf-pdf.pdf

  • 35
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager