Comparaisons d'une séquence à une base de données

  1. BLAST: les bases

    comparer la séquence CC16_SCHPO de Swiss-Prot à la base de données non-redondante de protéines avec le programme BLAST. Utiliser les paramètres par défaut.

    1. Combien de séquences y a-t-il dans la base de données ? Combien d'amino-acides ?
    2. Que représente le score ? La E-value ?
    3. Trouve-t-on des homologues ?
    4. Essayer avec blosum90 et blosum45. Quel est l'effet en termes de sensibilité et de sélectivité ?
    5. Essayer sans le filtre à régions de basse complexité. Quel est l'effet en termes de sélectivité et de sensibilité ?

  2. La séquence W99073 d'EMBL est un EST de souris. Comparer cette séquence nucléotidique à Swiss-Prot, en utilisant le programme blastx (même site que l'exercice précédent).

    Questions :

    1. Cet EST correspond-il à une région codante ?
    2. La séquence complète de la protéine est-elle connue chez la souris ?
    3. Examiner la localisation des régions similaires. Sont-ils répartis régulièrement le long de l'EST, ou y a-t-il des régions plus conservées que d'autres ? Les régions conservées ont-elles une fonction commune ?

  3. Mettre en évidence les exons et les introns du gène TNFA humain (HSTNFAB) en le comparant aux protéines avec blastx. Quel est l'effet des filtres à basse complexité ?

  4. L'entrée EMBL U22894 contient la séquence d'un élément amplifiable de Streptomyces lividans, une bactérie. Il est fait mention d'un ORF (Open Reading Frame, qui encode une protéine hypothétique) nommé ORF 4.7. Comparer cet ORF aux bases de données de protéines.

    Questions :

    1. Quelles parties de la protéine hypothétique sont similaires à d'autres séquences ?
    2. Combien de types différents de domaines contient-elle ?
    3. L'annotation "chitinase homolog" dans EMBL est-elle correcte ?

Thomas Junier
Last modified: Sun Dec 13 15:51:11 CET 1998