Em formação

Todos os alinhamentos de sequência múltipla empregam algoritmos de alinhamento global?

Todos os alinhamentos de sequência múltipla empregam algoritmos de alinhamento global?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Alinhamentos de várias sequências geralmente são feitos entre sequências de comprimento semelhante, que se assemelha melhor a um alinhamento global. No entanto, não tenho certeza de qual seria o background algorítmico nesse caso. É essencialmente um alinhamento global ou local quando alguém executa um alinhamento de sequência múltipla?


É perigoso generalizar, pois diferentes programas de alinhamento de seqüência múltipla (MSA) podem empregar algoritmos diferentes. No entanto, como o objetivo é alinhar muitas sequências ao longo de todo o seu comprimento, e todos os programas MSA dos quais tenho conhecimento apresentam os resultados como tais, é difícil imaginar outra coisa senão alinhamento global sendo empregado.

Para o Clustal W e X amplamente utilizado, este é certamente o caso. Clustal emprega um algoritmo de alinhamento progressivo que envolve a suposição heurística de que as sequências mais alinhadas por alinhamento de pares são uma base válida para a ordem em que o alinhamento múltiplo progressivo é executado. Os alinhamentos iniciais de pares (que são usados ​​para produzir uma árvore guia) usam alinhamento global dinâmico, assim como cada etapa de alinhamento progressivo, embora esse alinhamento seja para um perfil de sequências previamente alinhadas e use pontuação dependente do contexto.

Há um extenso artigo na Wikipedia sobre MSA e um dos artigos originais do Clustal está disponível gratuitamente on-line. O excelente livro de Durbin et al., Biological Sequence Analysis, contém um capítulo sobre o assunto.


O alinhamento de várias sequências é uma tarefa muito complexa e existem várias abordagens, dependendo do que você está procurando.

Um alinhamento global pode encontrar a região geral mais próxima. No entanto, é um problema bem conhecido com os comprimentos. Se os comprimentos das sequências forem muito diferentes, isso pode gerar alinhamentos incorretos.

O alinhamento local busca as melhores regiões correspondentes ao longo das sequências.

É bem sabido que algumas regiões genômicas tendem a acumular mais mutações do que outras. Para isso, sugere-se a ideia de domínios. A ideia principal por trás (e para torná-la mais simples) é como realizar vários alinhamentos locais a fim de obter os alinhamentos ideais para diferentes regiões de suas sequências.

Existem muitos algoritmos que implementam métodos muito diferentes para fazer isso: de alinhamentos de pares a perfis HMM.

Eu recomendaria ler este artigo.


Assim como James disse, esses termos não são totalmente exclusivos.
sua afirmação não está correta:

Múltiplos alinhamentos de sequência são geralmente feitos entre sequências de comprimento semelhante

Realmente depende do que você deseja alcançar com seu MSA (alinhamento de seqüência múltipla). Primeiro, uma breve explicação sobre o alinhamento local e global (a diferença entre os dois é descrita anteriormente nesta pergunta):
alinhamento local: tentar combinar uma parte de sua sequência de interesse com outra sequência, isso poderia ser feito com a MSA pense no BLAST. Usando o BLAST, você está realizando um alinhamento de sequência local com todas as sequências no banco de dados. Ao usar este alinhamento local, você está se concentrando em partes que se sobrepõem entre sua sequência e aquelas no banco de dados -> pista sobre domínios, por exemplo,
alginemnt global: o casamento de toda a sequência com outra sequência, que NÃO precisa ter o mesmo tamanho. Ao usar um alinhamento global com sequências de comprimentos diferentes, por ex. o que vai acontecer é que dependendo do algoritmo que está sendo usado (Needleman-Wunsch), haverá lacunas inseridas para coincidir com essas sequências em todo o comprimento.
Alguns exemplos práticos de quando usar qual alinhamento:

  • Fazendo perfis de um grupo de proteínas -> alinhamento global
  • Intersted em proteínas homólogas -> na maioria das vezes você usa um alinhamento de sequência local, especialmente quando você sabe que os homólogos estão bem distantes, então não há muita similaridade de sequência.
  • procurando proteínas que poderiam ter função semelhante -> alinhamento local, o BLAST fornecerá as proteínas que possuem os mesmos domínios, por ex. ou a mesma estrutura ao explodir contra o banco de dados PDB, o que pode fornecer pistas importantes sobre a função da proteína de interesse.

NOTE que essas sugestões são apenas alguns exemplos, algumas pessoas irão preferir uma outra opção.


Assista o vídeo: Alinhamento MÚLTIPLO de sequências. Clustal W: um dos artigos mais citados da Bioinformática (Agosto 2022).