Bioinformatique cours4 blast

Page Facebook Dom aine SNV Biologie Agronom ie Science Alim entaire Ecologie www facebook com Dom aineSNV Cours BLAST idée lire un résultat de Blast la famille Blast Bioinformatique L Microbiologie Responsable du module Dr BAKLI Mahfoud E-mail mahfoud bakli gmail com C quelle est la similarité entre ces séquences et donc est-ce que ces deux séquences sont homologues existe-t-il des séquences homologues à la mienne parmi toutes les séquences connues ex UniProt millions de séquences AA seq Smith Waterman s x millions ? heures jours CBLAST ou l'art du raccourci Smith-Waterman séquence contre tout UniProt jours BLAST séquence contre tout UniProt secondes C CBLAST comment vivre sans CGoogle fouiller l'Internet Requête Portée d'après P Hingamp CBLAST fouiller les séquences biologiques Requête Portée Blast NCBI BLA ST NR SWISSPROT PDB d'après P Hingamp CBLAST NCBI facile requête votre séquence portée à qui vous voulez la comparer c ? est parti CLes résultats de BLAST récapitulatif de la requête représentation graphique des résultats résumé des résultats les alignements CLes résultats de BLAST quelle séquence a été soumise query identi ?ant longueur type récapitulatif de la requête quelle banque de donnée est interrogée quel programme est utilisé CLes résultats de BLAST représentation graphique des résultats ce trait représente la séquence soumise long AA chaque trait de couleur représente un alignement entre la séquence de départ et une séquence de la banque de donnée sélectionnée couleur ?score longueur ?taille de l'alignement HSP high scoring pair Cidenti ?ant Les résultats de BLAST descriptif résumé des résultats score couverture E-value chaque ligne du résumé correspond à un trait coloré dans la représentation graphique CLes résultats de BLAST les alignements query ?la séquence soumise subject ?la séquence trouvée dans la bdd alignement outil QUANTITATIF - scores - Expect ou E-value - identité - positif - de gaps CLes paramètres cachés de BLAST nombre max de séquences cibles seuil sur l'E-value taille de l'amorce choix de la matrice de substitution score des gaps pourquoi y a-t-il paramètres - Existence - Extension C CAvantage du score CScores et statistiques de BLAST on va fabriquer une séquence arti ?cielle de acides aminés AA tirés au hasard parmi les random sequence consisting of residues AGCALTLIQRYCQDCGSPEVQTGSNPYAAAHHDMGSFGVACGQDEDKGCRAGGQDQGDVP PMNWTQACDSTTHYWQMCQHPINTWDSFKWFMRHKCWRQFQNFHVFPMVGDICQPLEKHI NKGMYPKAYLSKVWHEFWRCAVYNMHDMRCFFAKTEDTQWGYWPDAKLIRKKLFTDNDEL WTGNNWNAEHFFSQCQGIQDRKPHNWSIHLLNLCCGAFRTQFHGSGCRDVDTSWGWWIYY LCWVRIQMNEGFE BLAST contre SwissProt CDé ?nition de l'e-value de BLAST est ce que cet alignement traduit une homologie entre les séquences NON Cl'E-value de BLAST E-value de X on s'attendrait à trouver X alignements de score équivalent purement par chance contre une banque de données de taille équivalente s Evalue e- je m'attends à trouver en moyenne alignements de score purement par hasard si je blaste séquences aléatoires j'en obtiendrai s Evalue e- il faut que je blaste e séquences aléatoires avant de tomber au hasard sur un alignement de cette qualité CDé ?nition de l'e-value de BLAST pas le signe d'une homologie zone incertaine twilight zone - homologie certaine faux-positifs on a un alignement mais les séquences ne sont pas homologues CSwissProt séquences millions d'AA BLAST ma séquence BLAST nr-prot millions

  • 34
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise
Partager