Introduction Sommaire Historique et situation française Qu'est-ce que la bioinf
Introduction Sommaire Historique et situation française Qu'est-ce que la bioinformatique ? Les différentes facettes de la bioinformatique La Bioinformatique est la discipline de l'analyse de l'information biologique, en majorité sous la forme de séquences génétiques et de structures de protéines. C'est une branche théorique de la Biologie, largement antérieure à la récente "révolution génomique". Malgré son nom, la "bioinformatique" ne doit pas être confondue avec une simple application aux données biologiques des concepts et des outils de l'informatique traditionnelle. Historique et situation française Le terme de " Bioinformatics " n'est apparu dans la littérature scientifique qu'au tout début des années 90. Cependant, ce domaine de recherche ne vient pas d'émerger. Bien avant que cette discipline ne soit mise sous les feux de la rampe par l'essor de la génomique, quelques dizaines de laboratoires dans le monde travaillaient depuis longtemps en " biomathématique ", une discipline constituée pour répondre aux besoins précoces (dès 1965 !) de la phylogénie moléculaire. Le tableau I retrace les grandes étapes de la bioinformatique, et montre à quel point cette discipline a accompagné et souvent précédé le développement des concepts biologiques et des outils informatiques sur laquelle elle est fondée. Tableau I Étapes-clés dans l'histoire de la bioinformatique 1951 Première séquence protéique (Insuline, Sanger) 1960 Lien entre séquence & structure (Globines, Perutz) 1965 Premier Ordinateurs IBM/360 1965 "Evolutionary divergence and convergence in Proteins" (Zuckerkandl & Pauling) 1967 "Construction of Phylogenetic Trees" Fitch & Margoliash. 1968 Atlas of Protein Sequences (M. Dayhoff, Georgetown) 1968 mini-ordinateur DEC PDP-8 1970 "A general method applicable to the search for similaries in sequences of two proteins" (Needleman & Wunsch). 1971 Premier travaux sur le repliement des ARNs (J. Ninio) 1972 Premier microprocesseur Intel 8008 1973 "Génie Génétique" (Cohen et al.) 1974 "Prediction of Protein Conformation" (Chou & Fasman) 1975 Intel 8080, kit Altair 1977 mini-ordinateur DEC-VAX. Micro-ordinateurs (Apple, Commodore, Radioshack Séquençage d'ADN (Sanger, Maxam, Gilbert) 1977 Premier "package" Bioinformatique (Staden) 1978 Bases de données: ACNUC, PIR, EMBL, GenBank 1980 Accès téléphonique à la base de données PIR 1981 IBM-PC (8088), 16-32kb 1981 Los Alamos-GenBank: 270 séquences, 370.000 nucléotides Programme d'alignement local (Smith-Waterman) 1983 IBM-XT Disque DUR (10 Mbytes) 1984 MacIntosh : interface graphique & souris 1985-88 Programme "Fasta" (Pearson-Lipman) 1989 INTERNET succède à ARPANET et BITNET 1990 Programme "Blast" (Altschul et al.) 1990 Clonage positionnel et séquençage de NF-1 1991 "Grail", programme performant pour localiser les gènes (Mural et al.) 1991 Étiquettes d'ADNc "EST" (Venter et al., Matsubara et al.) 1992 Séquençage complet du chromosome III de levure 1995 Première séquence complète d'un micro-organisme (Venter et al.; H. influenza) 1996 Séquence complète de la levure (consortium européen) 1997 Programme "Gapped Blast" (Alschul et al.) 1997 11 génomes bactériens disponibles 1998 2 Mbase/jour de nouvelles séquences publiques 2001 Séquence ("premier jet") complète du génome humain. Une partie du retard pris en Europe continentale (et en France) dans ce domaine (la bioinformatique, publique ou privée, est à 90% anglosaxonne) peut être attribué à une méconnaissance de l'origine et de l'histoire déjà longue des biomathématiques, et à la confusion associée au nouveau terme de " Bioinformatique ". Les quelques actions en faveur de cette discipline ont été exercées dans un contexte multidisciplinaire Informatique/Biologie, qui n'a jamais collé à la réalité d'un domaine de recherche déjà bien structuré autour de concepts et techniques spécifiques. Nous sommes actuellement en face d'un quasi monopole américain dans le domaine de l'accès à la bibliographie et aux banques de données. Ce déséquilibre a, entre autre, forcé l'adhésion de l'Europe continentale à la "convention des Bermudes" qui impose la publication immédiate des séquences, et favorise objectivement le processus américain de valorisation industrielle. Une circonstance fortuite donne pourtant à la France l'occasion de combler ce retard. L'explosion de l'industrie génomique et biotechnologique aux USA et en Angleterre, a eu l'effet paradoxal d'y détruire le tissu universitaire en bioinformatique. En effet, les laboratoires " académiques " n'ont pas résisté à la défection des nombreux bioinformaticiens qui ont répondu aux campagnes de recrutements massifs menés par Smithkline- Beecham, Glaxo, Merck, etc., et par une multitudes de plus petites entreprises comme Millennium, Incyte, Human Genome Science, etc. La mise en place rapide de nouvelles filières universitaires s'appuyant sur les laboratoires existants, et un effort de recrutement ciblé par les organismes de recherche, permettrait à la France de combler ce vide, tout en offrant de réels débouchés aux étudiants. Plusieurs milliers de nouveaux ingénieurs et chercheurs bioinformaticiens seront en effet nécessaires à l'interprétation des données générées (au rythme de plusieurs millions de nucléotides /jour) au cours des 5 prochaines années. Pour les anglo-saxons, le terme de " bioinformatics " distingue la discipline spécifiquement consacrée à l'étude des séquences et des structures, du terme générique de " biocomputing " (traitement sur ordinateur des données biologiques). De fait, les " computer scientists " anglo-saxons n'ont pas d'affinité particulière avec la " bioinformatics ". En français, au contraire, le terme " bioinformatique " a suggéré qu'une implication forte des informaticiens dans cette discipline était naturelle et nécessaire.)) Qu'est-ce que la Bioinformatique ? La bioinformatique est constituée par l'ensemble des concepts et des techniques nécessaires à l'interprétation de l'information génétique (séquences) et structurale (repliement 3-D). C'est le décryptage de la " bio-information " (" Computational Biology " en anglais). La bioinformatique est donc une branche théorique de la Biologie. Son but, comme tout volet théorique d'une discipline, est d'effectuer la synthèse des données disponibles (à l'aide de modèles et de théories), d'énoncer des hypothèses généralisatrices (ex. : comment les protéines se replient ou comment les espèces évoluent), et de formuler des prédictions (ex. : localiser ou prédire la fonction d'un gène). Depuis son origine, la Bioinformatique a accompagné et/ou précédé l'acquisition de l'information génétique. Elle n'est donc pas un " produit " de la génomique mais, comme la biologie moléculaire, elle en est un domaine fondateur. La bioinformatique a aussi accompagné et encouragé l'utilisation des ordinateurs en biologie depuis leur origine. La bioinformatique n'est pas pour autant dérivée de la " science " informatique ; elle n'est (comme l'aéronautique, la banque ou la physique) qu'utilisatrice des ordinateurs et de leurs langages. Un véritable " bioinformaticien " n'est donc pas le simple croisement d'un biologiste et d'un informaticien (pas plus qu'un neurochirurgien n'est celui d'un psychiatre et d'un anatomiste). Il manipule et conçoit des notions originales et doit être familier avec certains domaines mathématiques liés à l'origine de l'informatique (théorie de l'information, théorie des graphes, probabilités et processus stochastiques). En statistiques, par exemple, la bioinformatique a contribué à l'essor de l'approche bayésienne et à celle de l'analyse des valeurs extrêmes. Le suffixe " Informatique " doit donc être compris comme renvoyant à l'interprétation de " l'information " biologique, et non pas à l'utilisation de l'ordinateur. Le bioinformaticien qui formule des prédictions fonctionnelles ou structurales, joue ainsi un rôle croissant dans l'argumentaire des demandes de brevets (ex : " ce gène partage tel motif avec tel autre, a donc telle fonction probable, et peut donc être à la base de telle application pharmacologique "). La génomique utilise aussi l'informatique traditionnelle pour l'acquisition des données (instrumentation, robotique), leur archivage (bases de données) ou leur consultation (interface utilisateurs). Ces technologies ne sont pas spécifiques et ne sont pas liées à l'émergence de concepts nouveaux issus de la Biologie. Ces applications de l'ordinateur n'appartiennent donc pas à la bioinformatique telle qu'elle est définie ici. Bien que la confusion soit courante, la bioinformatique ne recouvre donc pas tous les domaines d'utilisation des ordinateurs en Biologie. Les domaines respectifs de la bioinformatique et de l'informatique peuvent être décrits comme suit : Les différentes facettes de la bioinformatique Pour l'analyse des données expérimentales que représentent les séquences biologiques, cet apport informatique concerne principalement quatre aspects : Compilation et organisation des données Cet aspect concerne essentiellement la création de bases de données. Certaines ont pour vocation de réunir le plus d'informations possible sans expertise particulière de l'information déposée alors que d'autres sont spécialisées dans un domaine considéré avec l'intervention d'experts. Ces dernières bases sont généralement construites autour de thèmes précis comme l'ensemble des séquences d'une même espèce ou les facteurs de transcription. Incontestablement, toutes ces banques de données constituent une source de connaissance d'une grande richesse que l'on peut exploiter dans le développement de méthodes d'analyse ou de prédiction. Traitements systématiques des séquences L’objectif principal est de repérer ou de caractériser une fonctionnalité ou un élément biologique intéressant. Ces programmes représentent les traitements couramment utilisés dans l'analyse des séquences comme l'identification de phases codantes sur une molécule d'ADN ou la recherche de similitudes d'une séquence avec l'ensemble des séquences d'une base de données. Elaboration de stratégies Le but est d’apporter des connaissances biologiques supplémentaires que l'on pourra ensuite intégrer dans des traitements standard. On peut donner comme exemples la mise au point de nouvelles matrices de substitution des acides aminés, la détermination de l'angle de courbure d'un segment d'ADN en fonction de sa séquence primaire, ou encore la détermination de critères spécifiques dans la définition de séquences régulatrices. Evaluation des différentes approches dans le but de les valider. uploads/Science et Technologie/ genet-bio-info-complet.pdf
Documents similaires
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/fEVIjNUL6jEtr9qIttSWRQp2EbgBUeFxdY2sIOcVL8D6bhvnf84rkitX94ZMSjkeCy06KWVW2N2iInX9zwArESiL.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/Y3fFxrlmcXSSK4BlDGjdTrlM4g6esfgyozIYhH11aR4QTT0kbGzZ3Zk868EfwvKSzqDbabf4UmyrScZnPjdxFSI1.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/HV6iIake4bxLkM0CUGbWy1l4AkH7PL4NgYlaUtC4JYwtYnF39s2YpodbvIe3CVa0rFoTWw7IolnjXyinVPOsi4aH.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/gJrttfLszsjiYZjcnGi2necPMzBWdKj5wUABV8kGJI07a5YKl5Vropd7i65HHKvN94xNpmXhS1XzRCcoG0bFbpPN.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/T8SUYNQDCgV36I5UiX53bYFdfmnbGRF4wJMMR6brmHLVze4Bmb4gHjGuyEDX9DcGNUmBQFPdTOimzocE78jx7s9h.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/FASZC03mC4jy7Vvuz2kWRpERDIbitXEiKMvYfxt7NYuAxJb9Jgt1IqeZlwXR1dpJYBNlllVRyDR20xOwdO7gemZh.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/ZkkYZqE2GiD0YyeyRhO5xuYV7zml2jHrJzWw3aSnzVCn0OmdhfuGzmqWBsxWLPXp5DqFXNHdczv1FWuaWPViGXor.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/oGecUuhnU1yfabLIRpzCPK8vxPoNJ8AuXUOBHpiXeptEn6gST7VKEHnTNocNncLC3GIOGEWNGx3iZ6hDVDvo7lrv.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/sZ5L5rDNmhSHub1TKW7lh5DFOkiUeJxMZYejU4wOLY1Q79TaqoaUy1AtdsiiWX9hdXTz2rFht8BU2SGWMjYDEEOF.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/Ipd5lXUYJOoQOEevxNkvGyDycAFGlbjvB2gKs9l0C4I73w2ZKqDj2bBZEnszoa76YdevxTZugoJRMRfsOKTEfYT0.png)
-
29
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Dec 15, 2021
- Catégorie Science & technolo...
- Langue French
- Taille du fichier 1.5717MB