HMMER

HMMER é um e pacote de software livre comumente usado para análise de sequência escrito por Sean Eddy.^[1] Seu uso geral é identificar sequências homólogas de proteínas ou nucleotídeos, e executar alinhamentos de sequência. Ele detecta homologia comparando um perfil HMM para uma única sequência ou um banco de dados de sequências. Sequências que marcam significativamente melhor para o perfil HMM em comparação com um modelo nulo são considerados homólogos às sequências utilizadas para construir o perfil HMM. Perfis HMMs são construídos de um alinhamento múltiplo de sequências no pacote HMMER usando o programa hmmbuild (um “construtor” para HMM). A implementação de perfil HMM usada no software HMMER foi baseada no trabalho de Krogh e colegas.^[2] HMMER é um console utilitário portado para todos os principais sistemas operacionais, incluindo diferentes versões de Linux, Windows e Mac OS.

HMMER é o utilitário central sobre o qual bancos de dados de família de proteínas, como Pfam e InterPro são baseados. Algumas outras ferramentas de bioinformática, como UGENE também usam HMMER.

O HMMER3 também faz uso extensivo de instruções vetoriais para aumentar a velocidade computacional. Este trabalho é baseado em publicações anteriores mostrando uma aceleração significativa do algoritmo de Smith-Waterman para o alinhamento de duas seqüências.^[3]

Referências

↑ Durbin, Richard; Sean R. Eddy; Anders Krogh; Graeme Mitchison (1998). Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids. [S.l.]: Cambridge University Press. ISBN 0-521-62971-3
↑ Krogh A, Brown M, Mian IS, Sjölander K, Haussler D (fevereiro de 1994). «Hidden Markov models in computational biology. Applications to protein modeling». J. Mol. Biol. 235 (5): 1501–31. PMID 8107089. doi:10.1006/jmbi.1994.1104
↑ Farrar M (janeiro de 2007). «Striped Smith-Waterman speeds database searches six times over other SIMD implementations». Bioinformatics. 23 (2): 156–61. PMID 17110365. doi:10.1093/bioinformatics/btl582

[1] Durbin, Richard; Sean R. Eddy; Anders Krogh; Graeme Mitchison (1998). Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids. [S.l.]: Cambridge University Press. ISBN 0-521-62971-3

[pmid8107089-2] Krogh A, Brown M, Mian IS, Sjölander K, Haussler D (fevereiro de 1994). «Hidden Markov models in computational biology. Applications to protein modeling». J. Mol. Biol. 235 (5): 1501–31. PMID 8107089. doi:10.1006/jmbi.1994.1104

[pmid17110365-3] Farrar M (janeiro de 2007). «Striped Smith-Waterman speeds database searches six times over other SIMD implementations». Bioinformatics. 23 (2): 156–61. PMID 17110365. doi:10.1093/bioinformatics/btl582

[1]

[2]

[3]