Saltar ao contido

Dominio proteico

Na Galipedia, a Wikipedia en galego.
A piruvato quinase é unha proteína con tres dominios. (PDB 1PKN).

Un dominio proteico é unha parte conservada dunha determinada secuencia e estrutura de proteína que pode evolucionar, funcionar e existir independentemente do resto da cadea proteica. Cada dominio forma unha estrutura tridimensional compacta e a miúdo pode ser estable e estar pregado independentemente. Moitas proteínas constan de varios dominios estruturais. Un dominio pode aparecer en moitas proteínas diferentes. A evolución molecular utiliza os dominios como bloques de construción de proteínas e estes poden ser recombinados en diferentes arranxos para crear proteínas con diferentes funcións. Os dominios varían en lonxitude desde os que teñen uns 25 aminoácidos ata os de 500 aminoácidos. Os dominios máis curtos, como os dedos de cinc, están estabilizados por metais iónicos ou pontes disulfuro. Con frecuencia, os dominio forman unidades funcionais, como os dominios que se unen ao calcio chamados man EF da calmodulina. Como son estables independentemente, os dominios poden ser "intercambiados" por medio de técnicas de enxeñaría xenética entre dúas proteínas para construír así unha proteína quimérica.

Introdución

[editar | editar a fonte]

O concepto de dominio propúxoo en 1973 Wetlaufer despois de facer estudos de cristalografía de raios X do lisozima de galiña [1] e papaína [2] e por estudos de proteólise limitada de inmunoglobulinas.[3][4] Wetlaufer definiu dominio como unha unidade estable da estrutura das proteínas que podía pregarse autnomamente. No pasado os dominios eran definidos como unidades de:

  • estrutura compacta[5]
  • función e evolución[6]
  • pregamento.[7]

Cada definición é válida e a miúdo as definicións solápanse, é dicir, un dominio estrutural compacto que se encontra en diversas proteínas é probable que se pregue independentemente no seu ambiente estrutural. A natureza a miúdo reúne varios dominios para formar proteínas mutidominio e multifuncionais e as combinacións teñen un enorme número de posibilidades diferentes.[8] Nunha proteína multidominio, cada dominio pode desempeñar a súa propia función independentemente, ou de modo concertado cos seus dominios veciños. Os dominios poden servir como módulos para a construción de grandes ensamblaxes como partículas de virus ou fibras musculares, ou poden proporcionar sitios catalíticos ou de unión específicos como se observa en encimas e proteínas reguladoras.

Un exemplo ilustrativo é a piruvato quinase, un encima glicolítico que xoga un importante papel na regulación do fluxo desde a frutosa 1,6-bisfosfato ao piruvato. Contén un dominio regulatorio todo-β, un dominio de unión ao substrato α/β e un dominio de unión ao nucleótido α/β, conectado por varios polipeṕtidos de conexión [9] (ver a primeira figura). Cada dominio desta proteína aparece en distintas familias de proteínas.

O dominio de unión ao substrato de tipo barril-α/β central é un dos pregamentos en encimas máis comúns. Aparece en moitas familias de encimas que catalizan diversas reaccións sen ningunha relación entre si.[10] O barril-α/β denomínase xeralmente barril TIM, denominado así pola triosa-fosfato isomerase, que foi o primeiro encima en que se resolveu esa estrutura.[11] Actualmente clasifícase en 26 familias homólogas na base de datos de dominios CATH.[12] O barril TIM fórmase a partir dunha secuencia de motivos β-α-β pechada por un enlace de hidróxeno entre a primeira e a última cadea, formando un barril de oito cadeas. Debátese sobre a orixe evolutiva deste dominio. Un estudo suxeriu que un só encima ancestral tería diverxido en varias familias,[13] mentres que outro suxeriu que por evolución converxente se orixinou unha estrutura estable de barril TIM.[14]

O barril TIM da piruvato quinase é "descontinuo", o que significa que cómpre máis dun segmento do polipéptido para formar o dominio. Isto probablemente é o resultado da inserción dun dominio noutro durante a evolución das proteínas. Sábese por outras estruturas coñecidas que aproximadamente unha cuarta parte dos dominios estruturais son descontinuos.[15][16] O dominio regulador de barril-β é "continuou", e está feito dun único tramo de polipéptido.

A asociación covalente de dous dominios representa unha vantaxe funcional e estrutural, xa que hai un incremento de estabilidade cando se compara coas mesmas estruturas asociadas non covalentemente.[17] Outras vantaxes son a protección de intermediatos en fendas encimáticas interdominios que poderían doutro modo ser inestables en ambientes acuosos, e unha proporción estequiométrica fixa da actividade encimática necesaria para o conxunto secuencial de reaccións.[18]

Os dominios como unidades da estrutura das proteínas

[editar | editar a fonte]
Artigo principal: Estrutura das proteínas.

A estrutura primaria das proteínas (a cadea de aminoácidos) é a que finalmente determina a conformación tridimensional única da proteína.[19] O factor máis importante que goberna o pregamento dunha proteína na súa estrutura tridimensional é a distribución de cadeas laterais polares e non polares.[20] O pregamento está determinado polo agochamento das cadeas laterais hidrofóbicas no interior da molécula para evitar o contacto co ambiente acuoso. Xeralmente, as proteínas teñen unha parte central constituída por residuos hidrofóbicos rodeada por unha parte externa de residuos hidrofílicos. Como os propios enlaces peptídicos son polares, están neutralizados pola formación de enlaces de hidróxeno entre eles no ambiente hidrofóbico. Isto dá lugar a rexións do polipéptido que forman patróns de estruturas tridimensionais regulares chamadas estrutura secundaria. Hai dous tipos principais de estrutura secundaria: hélice α e folla β.

Algunhas combinacións simples de elementos da estrutura secundaria aparecen con frecuencia na estrutura das proteínas e denomínanse estruturas supersecundarias ou motivos estruturais. Por exemplo, o motivo forquita β consta de dúas cadeas β antiparalelas adxacentes unidas por un pequeno bucle. Está presente na maioría das estruturas β antiparalelas tanto en forma de fitas illadas coma formando parte de follas β máis complexas. Outra estrutura supersecundaria común é o motivo β-α-β, que se utiliza frecuentemente para conectar dúas cadeas β paralelas. As hélices α centrais conectan o C-terminal da primeira cadea co N-terminal da segunda, empaquetando as súas cadeas laterais contra a folla β e, por tanto, apantallando os residuos hidrofóbicos das cadeas β da influencia da superficie acuosa.

o aliñamento estrutural é unha importante ferramenta para a determinación dos dominios.

Os dominios e a estrutura terciaria

[editar | editar a fonte]

Varios dominios poden empaquetarse xuntos para formar unidades semiindependentes compactas locais chamadas dominios.[5] A estrutura tridimensional global da cadea polipeptídica denomínase estrutura terciaria. Os dominios son as unidades fundamentais da estrutura terciaria, e cada dominio contén unha parte central hidrofóbica constituída por unidades estruturais secundarias conectadas por rexións bucle. O empaquetamento do polipéptido é xeralmente moito máis compacto no interior que no exterior do dominio, o que orixina unha parte central case sólida e unha superficie máis fluída.[21] De feito, os residuos da parte central son a miúdo residuos que están conservados nunha familia de proteínas, mentres que os residuos dos bucles están menos conservados, a non ser que estean implicados na función da proteína. A estrutura terciaria da proteína pode dividirse en catro clases principais baseadas no contido estrutural secundario do dominio.[22]

  • Os dominios todo α teñen unha parte central do dominio formada exclusivamente de hélices α. Esta clase está dominada por pregamentos pequenos, moitos dos cales forman un feixe simple con hélices que soben e baixan.
  • Os dominios todo β teñen unha parte central composta de follas β antiparalelas, xeralmente dúas follas están empaquetas unha contra a outra. Poden identificarse varios patróns no arranxo das cadeas, e a miúdo dan lugar á identificación de motivos recorrentes, por exemplo o motivo greca.[23]
  • Os dominios α+β son unha mestura de motivos todo α e todo β. A clasificación das proteínas nesta clase é difícil porque hai solapamentos coas outras tres clases e, por tanto, non se utiliza na base de datos de dominios CATH.[12]
  • Os dominios α/β están constituídos por unha combinación de motivos β-α-β que forman predominantemente unha folla β paralela rodeada de hélices α anfipáticas. As estruturas secundarias están arranxadas en capas ou barrís.

Os dominios teñen límites de tamaño

[editar | editar a fonte]

Os dominios teñen un tamaño limitado.[24] O tamaño dun dominio estrutural individual varía desde os 36 residuos na E-selectina aos 692 residuos na lipoxixenase-1,[15] pero a maioría (90%) ten menos de 200 residuos[25] cunha media de aproximadamente 100 residuos.[26] Os dominios moi curtos, de menos de 40 residuos, están a miúdo estabilizados por ións metálicos ou pontes disulfuro. Os dominios máis longos, maiores de 300 residuos, probablemente constan de moitas partes centrais hidrofóbicas.[27]

Os dominios e a estrutura cuaternaria

[editar | editar a fonte]

Moitas proteínas teñen estrutura cuaternaria, que consta de varias cadeas polipeptídicas que se asocian formando unha molécula oligomérica. Cada cadea polipeptídica desas proteínas denomínase subunidade. A hemoglobina, por exemplo, consta de dúas subunidades α e dúas β. Cada unha das catro cadeas presenta un pregamento de globina todo α cun peto hemo.

O intercambio de dominios é un mecanismo para formar ensamblaxes oligoméricas.[28] No intercambio de dominios, un elemento de estrutura terciaria ou secundaria dunha proteína monomérica é substituído polo mesmo elemento doutra proteína. O intercambio de dominios pode ir desde elementos de estrutura secundaria a dominios estruturais completos. Tamén representa un modelo de evolución para a adaptación funcional por oligomerización, por exemplo, encimas oligoméricos que teñen o seu sitio activo en interfaces de subunidades.[29]

Os dominios como módulos evolutivos

[editar | editar a fonte]

A Natureza é unha reparadora e non unha inventora,[30] polo que nela se adaptan novas secuencias a partir de secuencias preexistentes en vez de inventar outras novas. Os dominios son o material común utilizado pola natureza para xerar novas secuencias. Poden considerarse como unidades móbiles xeneticamente, denominadas "módulos". A miúdo, os extremos C e N-terminais dos dominios están moi xuntos no espazo, o que permite que sexan facilmente "encaixados" en estruturas parentais durante o proceso da evolución. Moitas familias de dominios están presentes nas tres formas de vida, Archaea, Bacteria e Eukarya. Os dominios proteicos que se encontran repetidamente en diversas proteínas denomínanse xeralmente módulos, exemplos dos cales son os das proteínas extracelulares asociadas coa coagulación do sangue, fibrinólise, sistema do complemento, matriz extracelular, moléculas de adhesión da superficie celular e receptores de citocinas.[31]

A evolución molecular dá lugar a familias de proteínas relacionadas con secuencias e estruturas similares. Porén, a semellanza nas secuencias pode ser extremadamente baixa entre as proteínas que comparten a mesma estrutura. As estruturas de proteínas poden ser similares porque as proteínas diverxeron desde un antepasado común. Alternativamente, algúns pregamentos poden ser máis favorecidos que outros porque son arranxos estables de estruturas secundarias e algunhas proteínas poden converxer cara a estes pregamentos no decurso da evolución. Actualmente, hai determinadas unhas 90.000 estruturas en 3D de proteínas depositadas no PDB ( Protein Data Bank).[32] Porén, este conxunto contén moitas estruturas moi similares ou idénticas. Todas as proteínas deberían ser clasificadas en familias estruturais para comprender as súas relacións evolutivas. Como as comparacións estruturais se fan mellor a nivel de dominios, desenvolvéronse moitos algoritmos para asignar automaticamente dominios en proteínas con estruturas 3D coñecidas (véxase máis abaixo a "Definición de dominio a partir de coordenadas estruturais").

A base de datos de dominios CATH clasifica os dominios en aproximadamente 800 familias de pregamento; dez deses pregamentos teñen numerosos membros e denomínanse "superpregamentos" (super-folds). Os superpregamentos defínense como pregamentos nos cales hai polo menos tres estruturas sen unha semellanza de secuencia significativa.[33] O máis numeroso de todos é o superpregamento en barril α/β.

Proteínas multidominio

[editar | editar a fonte]

A maioría das proteínas xenómicas, ata unha proporción de dous terzos das mesmas nos organismos unicelulares e máis do 80% en metazoos, son proteínas multidominio orixinadas como resultado de eventos de duplicación xénica.[34] Moitos dominios en estruturas multidominio puideron ter existido inicialmente como proteínas independentes. Moitos dos dominios das proteínas multidominio eucarióticas poden atoparse en procariotas como proteínas independentes.[35] Por exemplo, os vertebrados teñen un polipéptido multiencimático que contén os módulos da GAR sintetase, AIR sintetase e GAR transformilase (GARs-AIRs-GARt; GAR: glicinamida ribonucleótido sintetase/transferase; AIR: aminoimidazol ribonucleótido sintetase). En insectos, o polipéptido aparece como GARs-(AIRs)2-GARt, en lévedos GARs-AIRs está codificado separadamente do GARt, e en bacterias cada dominio está codificado por separado.[36]

As proteínas multidominio probablemente apareceron por presión selectiva durante a evolución para crear novas funcións. Poden diverxer varias proteínas a partir de antepasados comúns por medio de diferentes combinacións e asociacións de dominios. As unidades modulares móvense frecuentemente dentro dun sistema ou entre sistemas biolóxicos por medio de mecanismos de intercambio xenético, que poden ser:

Tipos de organización

[editar | editar a fonte]
Diferentes insercións de módulos do dominio PH similares (granate) en dúas proteínas distintas.

A organización multidominio máis simple observada en proteínas é a dun só dominio repetido en tándem.[38] Os dominios poden interaccionar uns con outros (interacción dominio-dominio) ou permanecer illados, como doas dun rosario. A proteína muscular xigante titina de 30.000 residuos consta duns 120 dominios de tipo fibronectina III e tipo Ig.[39] Nas serina proteases, un evento de duplicación xénica levou á formación dun encima de dous dominios de tipo barril β.[40] Despois, as repeticións diverxeron tanto que xa non hai unha semellanza de secuencia obvia entre elas. O sitio activo está localizado nunha fenda entre os dous dominio barril β, nos cales os dous dominios contribúen con residuos funcionalmente importantes. Os mutantes obtidos por enxeñaría xenética da serina protease quimotripsina teñen certa actividade de proteinase mesmo cando os seus sitios activos foron anulados, polo que se postulou que ese evento de duplicación potención a actividade do encima.[40]

Os módulos mostran frecuentemente distintas relacións de conectividade, como ilustran as cinesinas e transportadores ABC. O dominio motor das cinesinas pode estar en calquera dos extremos da cadea polipeptídica, que inclúe unha rexión superenrolada e un dominio para o cargamento.[41] Os transportadores ABC están constituídos por ata catro dominios que constan de dous módulos non relacionados chamados casete de unión ao ATP e módulo de membrana integral, arranxados en varias combinacións.

Os dominios non só se recombinan, senón que hai moitos exemplos de que un dominio se insire noutro dominio. As semellanzas estruturais ou de secuencia con outros dominios demostran que os homólogos de dominios inseridos e parentais poden existir independentemente. Un exemplo son os "dedos" inseridos no dominio "palma" nas polimerases da familia Pol I.[42] Como calquera dominio pode ser inserido noutro, debería haber sempre polo menos un dominio continuo nunha proteína multidominio. Esta é a principal diferenza entre as definicións de dominios estruturais e dominios evolutivos/funcionais. Un dominio evolutivo estará limitado a unha ou dúas conexións entre dominios, mentres que os dominios estruturais poden ter conexións ilimitadas, dentro dun criterio dado da existencia dunha parte central común. Poden asignarse varios dominios estruturais a un dominio evolutivo.

Os dominios son unidades autónomas de pregamento

[editar | editar a fonte]

Pregamento

[editar | editar a fonte]
Artigo principal: Pregamento das proteínas.

Desde os traballos iniciais de Anfinsen hai máis de corenta anos,[19] o obxectivo de comprender completamente o mecanismo polo cal os péptidos se pregan rapidamente na súa conformación estable nativa permanece elusivo. Moitos estudos experimentais sobre o pregamento contribuíron a unha mellor comprensión do mecanismo, pero os principios que gobernan o pregamento das proteínas están aínda baseados principalmente no descuberto nos primeiros estudos sobre o pregamento. Anfinsen mostrou que o estado nativo dunha proteína é termodinamicamente estable, e a conformación está nun mínimo global da súa enerxía libre (ver tamén dogma de Anfinsen).

O pregamento é unha busca dirixida dun espazo conformacional que permite que a proteína se pregue nunha escala de tempo bioloxicamente factible. O paradoxo de Levinthal establece que se unha proteína de tamaño medio probase todas as posibles conformacións antes de atopar aquela que teña a menor enerxía, o proceso completo levaría miles de millóns de anos.[43] Pero as proteínas normalmente se pregan en de 0,1 a 1000 segundos. Por tanto, o proceso de pregamento das proteínas debe ser dirixido dalgún modo a través de vías específicas de pregamento. As forzas que dirixen esta busca son probablemente unha combinación de influencias locais e globais cuxos efectos se senten en varios estadios da reacción.[44]

Os avances nos estudos experimentais e teóricos mostraron que o pregamento pode verse en termos de paisaxes de enerxía,[45][46] nas que a cinética do pregamento está considerada como unha organización progresiva dun conxunto de estruturas parcialmente pregadas a través das cales pasa a proteína no seu camiño cara á unha estrutura pregada. Isto foi descrito en termos dun funil de pregamento (folding funnel), no cal unha proteína non pregada ten un gran número de estados conformacionais dispoñibles e hai poucos estados dispoñibles para a proteína pregada. Un funil implica que para o pregamento das proteínas hai unha diminución na enerxía e unha perda de entropía cun incremento da formación dunha estrutura terciaria. A maior inclinación local do funil reflicte a existencia de trampas cinéticas, que corresponden á acumulación de intermediarios mal pregados. Unha cadea en pregamento progresa cara a menores enerxías libres intracadea ao incrementar a súa compacticidade. As opcións conformacionais das cadeas fanse de forma crecente máis estreitas finalmente cara a unha estrutura nativa.

Vantaxe dos dominios para o pregamenteo das proteínas

[editar | editar a fonte]

A organización de proteínas grandes en dominios estruturais supón unha vantaxe para o pregamento das proteínas, xa que cada dominio pode pregarse individualmente, acelerando o proceso de pregamento e reducindo unha combinación potencialmente grande de interaccións entre residuos. Ademais, dada a distribución aleatoria observada de residuos hidrofóbicos nas proteínas,[47] a formación de dominios parece ser unha solución óptima para que as proteínas grandes agochen os seus residuos hidrofóbicos e manteñan na superficie os residuos hidrófilos.[48][49]

Porén, o papel de interaccións interdominios no pregamento das proteínas e na enerxética da estabilización da estrutura nativa, probablemente é diferente para cada proteína. No lisozima de T4, a influencia dun dominio noutro é tan forte que toda a molécula é resistente á clivaxe proteolítica. Neste caso, o pregamento é un proceso secuencial no que cómpre que primeiro o dominio C-terminal se pregue independentemente nun paso inicial, e despois os outros dominios requiren a presenza do dominio C-terminal pregado para o pregamento e estabilización.[50]

O pregamento dun dominio illado pode ter lugar á mesma velocidade ou ás veces máis rápido que o do dominio integrado,[51] o que suxire que durante o pregamento poden ocorrer interaccións non favorables co resto da proteína. Varios argumentos suxiren que o paso máis lento no pregamento de grandes proteínas é o emparellamento dos dominio pregados.[27] Isto é así porque os dominios non se pregan de forma enteiramente correcta ou porque os pequenos axustes necesarios para a súa interacción son enerxeticamente desfavorables,[52] como a eliminación de auga da interface entre dominios.

Definición dos dominios a partir de coordenadas estruturais

[editar | editar a fonte]

A importancia dos dominios como bloques de construción estruturais e elementos da evolución fixo que se creasen moitos métodos para a súa identificación e clasificación en proteínas de estrutura coñecida. Os procedementos automáticos para unha asignación de dominios fiable son esenciais para a xeración de bases de datos de dominios, especialmente a medida que se incrementa o número de estruturas de proteínas coñecidas. Aínda que se poden determinar os límites dun dominio cunha inspección visual, a construción de métodos automatizados non é inmediata. Aparecen problemas cando se trata con dominios descontinuos ou moi asociados.[53] O feito de que non haxa unha definición estándar de dominio significa que as asignacións de dominios varían enormemente, e cada investigador usa un conxunto único de criterios.[54]

Un dominio estrutural é unha subestrutura compacta globular con máis interaccións nel que no resto da proteína.[55] Xa que logo, un dominio estrutural pode ser determinado por dúas características visuais: a súa compacticidade e o seu grao de illamento.[56] As medidas de compacticidade local en proteínas utilizáronse en moitos dos primeiros métodos para asignación de dominios[57][58][59][60] e en varios dos métodos máis recentes.[25][61][62][63][64]

Un dos primeiros algoritmos[57] usou un mapa de distancia Cα-Cα xunto cunha rutina de agrupamento xerárquico que consideraba as proteínas como formadas por varios pequenos segmentos de 10 residuos de lonxitude. Os segmentos iniciais estaban agrupados un a continuación do outro baseándose en distancias intersegmentarias; os segmentos coas distancias máis curtas eran agrupados e considerados como segmentos simples a partir dese momento. O agrupamento paso a paso incluía finalmente a proteína completa. O investigador N. Go[60] tamén aproveitou o feito de que as distancias interdominios son normalmente máis grandes que as distancias intradominios; todas as posibles distancias Cα-Cα foron representadas como gráficos diagonais nos cales había distintos patróns para as hélices, cadeas estendidas e combinacións de estruturas secundarias.

O método de Sowdhamini e Blundell agrupa estruturas secundarias nunha proteína baseándose nas súas distancias Cα-Cα e identifica os dominios a partir do patrón no seus dendrogramas.[53] Como o procedemento non considera a proteína como unha cadea continua de aminoácidos non hai problemas en tratar os dominios descontinuos. Os nodos específicos nestes dendrogramas son identificados como agrupamentos estruturais terciarios da proteína, estes inclúen tanto estruturas supersecundarias coma dominios. O algoritmo DOMAK utilízase para crear a base de datos de dominios 3Dee.[62] Calcula o "valor de separación" ("split value") a partir do número de cada tipo de contacto cando a proteína se divide arbitrariamente en dúas partes. Este valor é grande cando as dúas partes da estrutura son distintas.

O método de Wodak e Janin[65] estaba baseado nas áreas de interface calculadas entre dous segmentos de cadea repetidamente clivados en residuos situados en varias posicións. As áreas de interface eran calculadas ao comparar áreas de superficie dos segmentos clivados cos da estrutura nativa. As fronteiras dos dominios potenciais poden identificarse nun sitio onde a área de interface está nun mínimo. Outros métodos utilizaron medidas de accesibilidade ao solvente para calcular a compacticidade.[25][66][67]

O algoritmo PUU[16] incorpora un modelo harmónico utilizado para dinámicas interdominio aproximadas. O concepto físico que subxace é que ocorren moitas interaccións ríxidas dentro de cada dominio e as interaccións máis laxas ocorren entre dominios. Este algoritmo utilízase para definir dominios na base de datos de dominios FSSP (Families of structurally similar proteins).[61]

Swindells (1995) desenvolveu un método chamado DETECTIVE para a identificación de dominios en estruturas proteicas baseado na idea de que os dominios teñen un interior hidrofóbico. Atopáronse deficiencias cando as partes centrais hidrofóbicas de diferentes dominios continúan pola rexión de interface.

RigidFinder é un novo método para a identificación de bloques ríxidos de proteínas (dominios e bucles) a partir de dúas conformacións diferentes. Os bloques ríxidos defínense como bloques nos que todas as distancias entre residuos están conservadas a través das conformacións.

Protestio et al. presentaron un método xeral de identificar dominios dinámicos, que son rexións da proteína que se comportan aproximadamente como unidades ríxidas no curso de flutuacións estruturais,[68] e, entre outras aplicacións, foi tamén utilizado para comparar a consistencia das subdivisións de dominios baseadas na dinámica coas estándar baseadas na estrutura. O método, denominado PiSQRD, está dispoñible ao público en forma de servidor web.[69] Este permite aos usuarios subdividir optimamente proteínas multiméricas ou de cadea simple en dominios case ríxidos[68][69] baseados nos modos colectivos de flutuación do sistema. Por defecto estes calcúlanse por medio dun modelo de rede elástica;[70] alternativamente o usuario pode subir espazos dinámicos esenciais precalculados.

Exemplos de dominios

[editar | editar a fonte]

Dominios de función descoñecida

[editar | editar a fonte]

Unha grande fracción dos dominios teñen funcións descoñecidas. Un dominio de función descoñecida é un dominio proteico para o que non se determinou unha función. Estas familias foron reunidas na base de datos Pfam utilizando para elas o prefixo DUF (domain of unknown function) seguido dun número; por exemplo DUF2992 e DUF1220. Actualmente hai unhas 3.000 familias DUF na base de datos Pfam que representan un 20% das familias coñecidas.[72]

Este artigo incorpora textos e imaxes da tese de George, R. A. (2002) "Predicting Structural Domains in Proteins", University College London, que son contribucións engadidas polo propio autor na versión inglesa.

  1. Phillips DC. (1966). "The three-dimensional structure of an enzyme molecule". Scientific American 215 (5): 78–90. PMID 5978599. doi:10.1038/scientificamerican1166-78. 
  2. Drenth J, Jansonius JN, Koekoek R, Swen HM, Wolthers BG.; Jansonius; Koekoek; Swen; Wolthers (1968). "Structure of papain". Nature 218 (5145): 929–32. Bibcode:1968Natur.218..929D. PMID 5681232. doi:10.1038/218929a0. 
  3. Porter RR. (1973). "Structural studies of immunoglobulins". Science 180 (4087): 713–6. Bibcode:1973Sci...180..713P. PMID 4122075. doi:10.1126/science.180.4087.713. 
  4. Edelman GM. (1973). "Antibody structure and molecular immunology". Science 180 (4088): 830–40. Bibcode:1973Sci...180..830E. PMID 4540988. doi:10.1126/science.180.4088.830. 
  5. 5,0 5,1 Richardson J. S. (1981). "The anatomy and taxonomy of protein structure". Adv Protein Chem 34: 167–339. PMID 7020376. doi:10.1016/S0065-3233(08)60520-3. Arquivado dende o orixinal o 10 de febreiro de 2019. Consultado o 02 de xuño de 2014. 
  6. Bork P. (1991). "Shuffled domains in extracellular proteins". FEBS Lett 286 (1–2): 47–54. PMID 1864378. doi:10.1016/0014-5793(91)80937-X. 
  7. Wetlaufer DB. (1973). "Nucleation, rapid folding, and globular intrachain regions in proteins". Proc Natl Acad Sci USA 70 (3): 697–701. Bibcode:1973PNAS...70..697W. PMC 433338. PMID 4351801. doi:10.1073/pnas.70.3.697. 
  8. Chothia C. (1992). "Proteins. One thousand families for the molecular biologist". Nature 357 (6379): 543–4. Bibcode:1992Natur.357..543C. PMID 1608464. doi:10.1038/357543a0. 
  9. George RA, Heringa J. (2002). "An analysis of protein domain linkers: their classification and role in protein folding". Protein Eng 15 (11): 871–9. PMID 12538906. doi:10.1093/protein/15.11.871. 
  10. Hegyi H, and Gerstein M. (1999). "The relationship between protein structure and function: a comprehensive survey with application to the yeast genome". J Mol Biol 288 (1): 147–64. PMID 10329133. doi:10.1006/jmbi.1999.2661. 
  11. Banner, D.W.; Bloomer, AC; Petsko, GA; Phillips, DC; Pogson, CI; Wilson, IA; Corran, PH; Furth, AJ; et al. (1975). "Structure of chicken muscle triose phosphate isomerase determined crystallographically at 2.5 angstrom resolution using amino acid sequence data". Nature 255 (5510): 609–614. Bibcode:1975Natur.255..609B. PMID 1134550. doi:10.1038/255609a0. 
  12. 12,0 12,1 Orengo CA, Michie AD, Jones S, Jones DT, Swindells MB, Thornton JM. (1997). "CATH--a hierarchic classification of protein domain structures". Structure 5 (8): 1093–108. PMID 9309224. doi:10.1016/S0969-2126(97)00260-8. 
  13. Copley, R. R. and Bork, P (2000). "Homology among (betaalpha)(8) barrels: implications for the evolution of metabolic pathways". J Mol Biol 303 (4): 627–641. PMID 11054297. doi:10.1006/jmbi.2000.4152. 
  14. Lesk AM, Brändén CI, Chothia C. (1989). "Structural principles of alpha/beta barrel proteins: the packing of the interior of the sheet". Proteins 5 (2): 139–48. PMID 2664768. doi:10.1002/prot.340050208. 
  15. 15,0 15,1 Jones S, Stewart M, Michie A, Swindells MB, Orengo C, Thornton JM. (1998). "Domain assignment for protein structures using a consensus approach: characterization and analysis". Protein Sci 7 (2): 233–42. PMC 2143930. PMID 9521098. doi:10.1002/pro.5560070202. 
  16. 16,0 16,1 Holm L, Sander C. (1994). "Parser for protein folding units". Proteins 19 (3): 256–68. PMID 7937738. doi:10.1002/prot.340190309. 
  17. Ghélis C, Yon JM. (1979). "[Conformational coupling between structural units. A decisive step in the functional structure formation]". C R Seances Acad Sci D 289 (2): 197–9. PMID 117925. 
  18. Ostermeier M, Benkovic SJ. (2000). "Evolution of protein function by domain swapping". Adv Protein Chem 55: 29–77. PMID 11050932. doi:10.1016/s0065-3233(01)55002-0. 
  19. 19,0 19,1 ANFINSEN CB, HABER E, SELA M, WHITE FH Jr.; Haber; Sela; White (1961). "The kinetics of formation of native ribonuclease during oxidation of the reduced polypeptide chain". Proc Natl Acad Sci USA 47 (9): 1309–14. Bibcode:1961PNAS...47.1309A. PMC 223141. PMID 13683522. doi:10.1073/pnas.47.9.1309. 
  20. Cordes, M. H., Davidson, A. R., and Sauer, R. T (1996). "Sequence space, folding and protein design". Curr Opin Struct Biol 6 (1): 3–10. PMID 8696970. doi:10.1016/S0959-440X(96)80088-1. 
  21. Zhou, Y., Vitkup, D., and Karplus, M (1999). "Native proteins are surface-molten solids: application of the Lindemann criterion for the solid versus liquid state". J Mol Biol 285 (4): 1371–1375. PMID 9917381. doi:10.1006/jmbi.1998.2374. 
  22. Levitt M, Chothia C. (1976). "Structural patterns in globular proteins". Nature 261 (5561): 552–8. Bibcode:1976Natur.261..552L. PMID 934293. doi:10.1038/261552a0. 
  23. Hutchinson EG, Thornton JM. (1993). "The Greek key motif: extraction, classification and analysis". Protein Eng 6 (3): 233–45. PMID 8506258. doi:10.1093/protein/6.3.233. 
  24. Savageau MA. (1986). "Proteins of Escherichia coli come in sizes that are multiples of 14 kDa: domain concepts and evolutionary implications". Proc Natl Acad Sci USA 83 (5): 1198–202. Bibcode:1986PNAS...83.1198S. PMC 323042. PMID 3513170. doi:10.1073/pnas.83.5.1198. 
  25. 25,0 25,1 25,2 Islam SA, Luo J, Sternberg MJ. (1995). "Identification and analysis of domains in proteins". Protein Eng 8 (6): 513–25. PMID 8532675. doi:10.1093/protein/8.6.513. 
  26. Wheelan, S. J. and Marchler-Bauer, A. and Bryant, S. H. (2000). "Domain size distributions can predict domain boundaries". Bioinformatics 16 (7): 613–618. PMID 11038331. doi:10.1093/bioinformatics/16.7.613. 
  27. 27,0 27,1 Garel, J. (1992). "Folding of large proteins: Multidomain and multisubunit proteins". En Creighton, T. Protein Folding (First ed.). New York: W.H. Freeman and Company. pp. 405–454. ISBN 0-7167-7027-X. 
  28. Bennett MJ, Schlunegger MP, Eisenberg D. (1995). "3D domain swapping: a mechanism for oligomer assembly". Protein Sci 4 (12): 2455–68. PMC 2143041. PMID 8580836. doi:10.1002/pro.5560041202. {
  29. Heringa J, Taylor WR. (1997). "Three-dimensional domain duplication, swapping and stealing". Curr Opin Struct Biol 7 (3): 416–21. PMID 9204285. doi:10.1016/S0959-440X(97)80060-7. 
  30. Jacob F. (1977). "Evolution and tinkering". Science 196 (4295): 1161–6. Bibcode:1977Sci...196.1161J. PMID 860134. doi:10.1126/science.860134. 
  31. Campbell ID, Downing AK. (1994). "Building protein structure and function from modular units". Trends Biotechnol 12 (5): 168–72. PMID 7764899. doi:10.1016/0167-7799(94)90078-7. 
  32. "Copia arquivada". Arquivado dende o orixinal o 07 de abril de 2015. Consultado o 02 de xuño de 2014. 
  33. Orengo CA, Jones DT, Thornton JM.; Jones; Thornton (1994). "Protein superfamilies and domain superfolds". Nature 372 (6507): 631–4. Bibcode:1994Natur.372..631O. PMID 7990952. doi:10.1038/372631a0. 
  34. Apic, G., Gough, J., and Teichmann, S. A (2001). "Domain combinations in archaeal, eubacterial and eukaryotic proteomes". J Mol Biol 310 (2): 311–325. PMID 11428892. doi:10.1006/jmbi.2001.4776. 
  35. Davidson JN, Chen KC, Jamison RS, Musmanno LA, Kern CB. (1993). "The evolutionary history of the first three enzymes in pyrimidine biosynthesis". BioEssays 15 (3): 157–64. PMID 8098212. doi:10.1002/bies.950150303. 
  36. Henikoff S, Greene EA, Pietrokovski S, Bork P, Attwood TK, Hood L.; Greene; Pietrokovski; Bork; Attwood; Hood (1997). "Gene families: the taxonomy of protein paralogs and chimeras". Science 278 (5338): 609–14. Bibcode:1997Sci...278..609H. PMID 9381171. doi:10.1126/science.278.5338.609. 
  37. Bork, P. and Doolittle, R. F (1992). "Proposed acquisition of an animal protein domain by bacteria2". Proc Natl Acad Sci USA 89 (19): 8990–8994. Bibcode:1992PNAS...89.8990B. PMC 50050. PMID 1409594. doi:10.1073/pnas.89.19.8990. 
  38. Heringa J. (1998). "Detection of internal repeats: how common are they?". Curr Opin Struct Biol 8 (3): 338–45. PMID 9666330. doi:10.1016/S0959-440X(98)80068-7. 
  39. Politou, A. S., Gautel, M., Improta, S., Vangelista, L., and Pastore, A (1996). "The elastic I-band region of titin is assembled in a 'modular' fashion by weakly interacting Ig-like domains". J Mol Biol 255 (4): 604–616. PMID 8568900. doi:10.1006/jmbi.1996.0050. 
  40. 40,0 40,1 McLachlan, A. D (1979). "Gene duplications in the structural evolution of chymotrypsin". J Mol Biol 128 (1): 49–79. PMID 430571. doi:10.1016/0022-2836(79)90308-5. 
  41. Moore JD, Endow SA. (1996). "Kinesin proteins: a phylum of motors for microtubule-based motility". BioEssays 18 (3): 207–19. PMID 8867735. doi:10.1002/bies.950180308. 
  42. Russell, R. B (1994). "Domain insertion". Protein Eng 7 (12): 1407–1410. PMID 7716150. doi:10.1093/protein/7.12.1407. 
  43. Levinthal, C. (1968). "Are there pathways for protein folding?" (PDF). J Chim Phys 65: 44–45. Arquivado dende o orixinal (PDF) o 02 de setembro de 2009. Consultado o 02 de xuño de 2014. 
  44. Dill KA. (1999). "Polymer principles and protein folding". Protein Sci 8 (6): 1166–80. PMC 2144345. PMID 10386867. doi:10.1110/ps.8.6.1166. 
  45. Leopold PE, Montal M, Onuchic JN.; Montal; Onuchic (1992). "Protein folding funnels: a kinetic approach to the sequence-structure relationship". Proc Natl Acad Sci USA 89 (18): 8721–5. Bibcode:1992PNAS...89.8721L. PMC 49992. PMID 1528885. doi:10.1073/pnas.89.18.8721. 
  46. Dill KA, Chan HS. (1997). "From Levinthal to pathways to funnels". Nat Struct Biol 4 (1): 10–9. PMID 8989315. doi:10.1038/nsb0197-10. 
  47. White SH, Jacobs RE. (1990). [hhttps://www.sciencedirect.com/science/article/pii/S0006349590826114 "Statistical distribution of hydrophobic residues along the length of protein chains. Implications for protein folding and evolution"]. Biophys J 57 (4): 911–21. Bibcode:1990BpJ....57..911W. PMC 1280792. PMID 2188687. doi:10.1016/S0006-3495(90)82611-4. 
  48. George RA, Heringa J. (2002). "SnapDRAGON: a method to delineate protein structural domains from sequence data". J Mol Biol 316 (3): 839–51. PMID 11866536. doi:10.1006/jmbi.2001.5387. 
  49. George RA, Lin K, Heringa J. (2005). "Scooby-domain: prediction of globular domains in protein sequence". Nucleic Acids Res 33 (Web Server issue): W160–3. PMC 1160142. PMID 15980446. doi:10.1093/nar/gki381. 
  50. Desmadril, M. and Yon, J. M (1981). "Existence of intermediates in the refolding of T4 lysozyme at pH 7.4". Biochem Biophys Res Commun 101 (2): 563–569. PMID 7306096. doi:10.1016/0006-291X(81)91296-1. 
  51. Teale JM, Benjamin DC. (1977). "Antibody as immunological probe for studying refolding of bovine serum albumin. Refolding within each domain". J Biol Chem 252 (13): 4521–6. PMID 873903. 
  52. Creighton, T. E. (1983). Proteins: Structures and molecular properties. Freeman, New York. Second edition.
  53. 53,0 53,1 Sowdhamini R, Blundell TL. (1995). "An automatic method involving cluster analysis of secondary structures for the identification of domains in proteins". Protein Sci 4 (3): 506–20. PMC 2143076. PMID 7795532. doi:10.1002/pro.5560040317. 
  54. Swindells, M. B (1995). "A procedure for detecting structural domains in proteins". Protein Sci 4 (1): 103–112. PMC 2142966. PMID 7773168. doi:10.1002/pro.5560040113. 
  55. Janin, J. and Wodak, S. J (1983). "Structural domains in proteins and their role in the dynamics of protein function". Prog Biophys Mol Biol 42 (1): 21–78. PMID 6353481. doi:10.1016/0079-6107(83)90003-2. 
  56. Tsai CJ, Nussinov R. (1997). "Hydrophobic folding units derived from dissimilar monomer structures and their interactions". Protein Sci 6 (1): 24–42. PMC 2143523. PMID 9007974. doi:10.1002/pro.5560060104. 
  57. 57,0 57,1 Crippen, G. M (1978). "The tree structural organisation of proteins". J Mol Biol 126 (3): 315–332. PMID 745231. doi:10.1016/0022-2836(78)90043-8. 
  58. Rossmann MG, Moras D, Olsen KW.; Moras; Olsen (1974). "Chemical and biological evolution of nucleotide-binding protein". Nature 250 (463): 194–9. Bibcode:1974Natur.250..194R. PMID 4368490. doi:10.1038/250194a0. 
  59. Rose GD. (1979). "Hierarchic organization of domains in globular proteins". J Mol Biol 134 (3): 447–70. PMID 537072. doi:10.1016/0022-2836(79)90363-2. 
  60. 60,0 60,1 Go N, Taketomi H.; Taketomi (1978). "Respective roles of short- and long-range interactions in protein folding". Proc Natl Acad Sci USA 75 (2): 559–63. Bibcode:1978PNAS...75..559G. PMC 411294. PMID 273218. doi:10.1073/pnas.75.2.559. 
  61. 61,0 61,1 Holm L, Sander C. (1997). "Dali/FSSP classification of three-dimensional protein folds". Nucleic Acids Res 25 (1): 231–4. PMC 146389. PMID 9016542. doi:10.1093/nar/25.1.231. 
  62. 62,0 62,1 Siddiqui AS, Barton GJ. (1995). "Continuous and discontinuous domains: an algorithm for the automatic generation of reliable protein domain definitions". Protein Sci 4 (5): 872–84. PMC 2143117. PMID 7663343. doi:10.1002/pro.5560040507. 
  63. Zehfus, M. H (1997). "Identification of compact, hydrophobically stabilized domains and modules containing multiple peptide chains". Protein Sci 6 (6): 1210–1219. PMC 2143719. PMID 9194181. doi:10.1002/pro.5560060609. 
  64. Taylor WR. (1999). "Protein structural domain identification". Protein Eng 12 (3): 203–16. PMID 10235621. doi:10.1093/protein/12.3.203. 
  65. Wodak, S. J. and Janin, J (1981). "Location of structural domains in protein". Biochemistry 20 (23): 6544–6552. PMID 7306523. doi:10.1021/bi00526a005. 
  66. Rashin, 1985
  67. Zehfus MH, Rose GD. (1986). "Compact units in proteins". Biochemistry 25 (19): 5759–65. PMID 3778881. doi:10.1021/bi00367a062. 
  68. 68,0 68,1 Potestio, R., Pontiggia, F. and Micheletti, C. (2009). "Coarse-grained description of protein internal dynamics: an optimal strategy for decomposing proteins in rigid subunits.". Biophysical Journal 96 (12): 4993–5002. Bibcode:2009BpJ....96.4993P. PMC 2712024. PMID 19527659. doi:10.1016/j.bpj.2009.03.051. 
  69. 69,0 69,1 Aleksiev, T., Potestio, R., Pontiggia, F., Cozzini, S. and Micheletti, C. (2009). "PiSQRD: a web server for decomposing proteins into quasi-rigid dynamical domains.". Bioinformatics 25 (20): 2743–4. PMID 19696046. doi:10.1093/bioinformatics/btp512. Arquivado dende o orixinal o 15 de abril de 2013. Consultado o 02 de xuño de 2014. 
  70. Micheletti, C., Carloni, P. and Maritan, A. Accurate and efficient description of protein vibrational dynamics: comparing molecular dynamics and gaussian models, Proteins, 55, 635, 2004.
  71. Barclay A (2003). "Membrane proteins with immunoglobulin-like domains--a master superfamily of interaction molecules". Semin Immunol 15 (4): 215–23. PMID 14690046. doi:10.1016/S1044-5323(03)00047-2. 
  72. Bateman A, Coggill P, Finn RD (October 2010). "DUFs: families in search of function". Acta Crystallogr. Sect. F Struct. Biol. Cryst. Commun. 66 (Pt 10): 1148–52. PMC 2954198. PMID 20944204. doi:10.1107/S1744309110001685. 

Véxase tamén

[editar | editar a fonte]

Outros artigos

[editar | editar a fonte]

Bibliografía

[editar | editar a fonte]

Ligazóns externas

[editar | editar a fonte]
  • A base de datos Protein Families (Pfam) buscador de clans proporciona un fácil acceso a información sobre dominios estruturais de proteínas. Un clan contén dúas ou máis familias Pfam que xurdiron a partir dunha soa orixe evolutiva.

Bases de datos de dominios estruturais

[editar | editar a fonte]

Bases de datos de dominios de secuencia

[editar | editar a fonte]

Bases de datos de dominios funcionais

[editar | editar a fonte]
  • dcGO Unha base de datos completa de ontoloxías dominiocéntricas de funcións, fenotipos e doenzas.