Un article de Wikipedia.y-project.com.
[] En quoi consiste l'alignement ?
L'alignement de séquences d'ADN ou d'acides aminés est une opération de base en bio-informatique qui a pour but d'identifier des zones conservées entre séquences. L'alignement sert notamment à :
- identifier des sites fonctionnels
- prédire la ou les fonctions d'une protéine
- prédire la structure secondaire (voire tertiaire) d'une protéine
- établir une phylogénie
Dans la compréhension du fonctionnement de la vie, les protéines jouent un rôle essentiel. On part donc de l'hypothèse que des protéines comportant des séquences similaires risquent fort de posséder des propriétés physico-chimiques identiques. À partir de l'identification de similarités entre la séquence d'une première protéine dont on connaît le mécanisme d'action et celle d'une deuxième protéine dont on ne connaît pas le mécanisme de fonctionnement, on peut inférer des similarités structurelles ou fonctionnelles sur la séquence non connue et proposer de vérifier de manière expérimentale le comportement d'action supposé.
On distingue deux types d'alignements qui diffèrent suivant leur complexité :
- l'alignement par paires qui consiste à aligner deux séquences peut être réalisé grâce à un algorithme de complexité polynomiale. Il est possible de réaliser un alignement :
- global, c'est-à-dire entre les deux séquences sur toute leur longueur
- local, entre une séquence et une partie de l'autre séquence
- l'alignement multiple, qui est un alignement global, consiste à aligner plus de deux séquences et nécessite un temps de calcul et un espace de stockage exponentiels en fonction de la taille des données.
[] Exemple
Soit les séquences S1 = { ACATT } et S1 = { AAGTT }, un alignement de S1 et S2 est par exemple :
S1 : A C A - T T
S2 : A - A G T T
Consensus : A . A . T T
Le Texte ci-dessus est disponible sous GNU Free Documentation License.
La source est wikipedia http://fr.wikipedia.org/wiki/Alignement de séquences