Comparaisons binaires

  1. Comparez les séquences OPRM_RAT et SSR1_HUMAN avec Lalign (alignement). Utilisez les valeurs par défaut des paramètres.

    Questions:

    1. S'agit-il d'un alignement global ou local ?

    2. Que signifie "% identity" ?

    3. Que signifient les symboles ":" et "." ?

    4. Quand deux résidus sont différents, il peut y avoir soit un "." soit un espace. Quelle est la différence, et quel paramètre influence sur ce résultat ?

    5. Quand deux résidus sont différents, on peut avoir soit un (mauvais) appariement (représenté par un espace), soit une lacune ("-"). De quels paramètres cela dépend-il ?

  2. Comparez les mêmes séquences avec Dotlet (comparaison matricielle).

    Questions:

    1. Que signifie l'intensité (niveau de gris) d'un pixel ?

    2. A quoi peuvent bien servir les seuils inférieur et supérieur ?

    3. Quelle est l'influence des seuils en terme de sélectivité et de sensibilité ?

    4. Y a-t-il un réglage optimal des seuils ?

    5. Quelle est l'influence de la taille de la fenêtre ?

    6. Que se passe-t-il lorsqu'on compare une séquence à elle-même ?

  3. Comparaison des méthodes de comparaison 1: Choisissez une ou plusieurs paires de séquences dans la liste ci-dessous, et comparez-les avec la méthode matricielle et la méthode de l'alignement. Evaluez la sigificativité des scores des alignements par shuffling.

    1. CO9_HUMAN - PERF_HUMAN

    2. FRA_DROME - GCN4_YEAST

    3. HBB_HUMAN - LGB1_PEA

    4. YOR6_ADEG1 - CD4_HUMAN

    5. NCK_HUMAN - SRC_CHICK

    Questions (la réponse peu dépendre de la paire considéreée) :

    1. Les séquences contiennent-elles des régions de similarité ? Si oui, lesquelles ?

    2. La similarité s'étend-elle sur toute la longueur des séquences ?

    3. Quelle méthode est la plus sensible ?

    4. Quelle est l'influence des pénalités de la matrice sur Lalign ?

    5. Quelle est l'influence de la taille de la fenêtre et de la matrice sur Dotlet ?

    6. Quels sont les avantages respectifs d'une méthode par rapport à l'autre ?

  4. Avec les mêmes outils que dans les exercices précédents, examinez les séquences ci-dessous. A quel phénomène biologique se correspondent-elles ?

    1. PAPA_CARPA - SERA_PLAFG

    2. ANCALM - ANCALM_5

    3. HS058362 - HS058362


Notes
1: Aussi appelée méta-comparaison. ;-)

Thomas Junier