Em formação

Por que adicionar hidrogênios em simulações de dinâmica molecular?

Por que adicionar hidrogênios em simulações de dinâmica molecular?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Em minha palestra de dinâmica molecular, nosso professor disse que sempre temos que adicionar átomos de hidrogênio a grupos tituláveis, antes de começarmos as simulações de campo de força, e que isso é especialmente importante para a histidina. Mas por que isso? Por que sempre temos que adicionar os átomos de hidrogênio? E só temos que fazer isso para grupos tituláveis, ou para todos?


O Banco de Dados de Proteínas RCSB (PDB) possui atualmente 137.917 estruturas depositadas, das quais menos de 10% foram resolvidas por ressonância magnética nuclear (RMN). A maioria das técnicas em biologia estrutural simplesmente não consegue resolver as posições dos hidrogênios nas estruturas macromoleculares; apenas NMR e difração de nêutrons fornecem as posições dos hidrogênios "por padrão". Portanto, todos os campos de força de dinâmica molecular de todos os átomos, os mais notáveis ​​dos quais são as séries OPLS, CHARMM e AMBER, requerem que as posições dos hidrogênios sejam deduzidas das estruturas macromoleculares iniciais e critérios e padrões geométricos, que as ligações de hidrogênio são conhecidas por geralmente segue, se a estrutura inicial não tiver hidrogênios. "Geralmente" é uma palavra importante a ser apontada aqui, já que geralmente não existe uma maneira única e inequívoca de colocar os hidrogênios em uma estrutura. Isso é especialmente verdadeiro para a histidina, onde o ambiente local de resíduos e / ou cofatores pode perturbar seu pKa de maneiras muitas vezes inesperadas. Simular a histidina no estado de protonação errado, quando essa histidina é um sítio ativo e crucial para o mecanismo e processo em estudo, pode levar a resultados espúrios, enganosos e / ou potencialmente sem sentido. Os hidrogênios são necessários para uma descrição fiel e (relativamente) realista da estrutura macromolecular, simplesmente porque estão sempre presentes nas macromoléculas e são cruciais para a estrutura e funcionamento macromolecular - lembre-se de que as ligações de hidrogênio estabilizam a estrutura secundária das proteínas, a dupla hélice do DNA, etc. ., além disso, frequentemente medeiam o reconhecimento e a função intermacromolecular. Assim, uma representação explícita dos hidrogênios é necessária. Os chamados campos de força de granulação grossa, os mais populares dos quais acredito serem as várias versões do MARTINI, agrupam hidrogênios junto com átomos mais pesados ​​para aumentar o intervalo de tempo de simulação e reduzir o número de partículas no sistema, mas esses campos de força são uma escolha muito ruim ao modelar reconhecimento e interações específicas.

Receio que as ambigüidades da protonação não são uma questão de opinião. Pode-se examinar todas as estruturas no PDB, apenas para descobrir que a maioria delas não tem hidrogênio. Pode-se explorar o link para o PDB que forneci; descobrir-se-á que das 131.917 estruturas no PDB, 123.461 foram resolvidas por cristalografia de raios-X, das quais apenas 10.749 têm uma resolução abaixo de 1,5 Å. Para resolver os hidrogênios, uma resolução abaixo de 1 Å é necessária. Na verdade, estruturas de cristal de alta resolução, estruturas de NMR e estruturas de difração de nêutrons (apenas 60 em todo o PDB!) São menos de 20% de todo o arquivo estrutural. Técnicas como microscopia eletrônica têm resoluções entre 4 e 10 Å; em tais casos, as pessoas não têm certeza sobre as posições dos átomos pesados; eles nem ousam pensar nos hidrogênios. Portanto, não são apenas os grupos tituláveis ​​que são problemáticos, na maioria das estruturas não é possível ver NENHUM hidrogênio. Claro, para backbones e cadeias laterais de alanina, provavelmente se tem uma boa estimativa de onde estão os hidrogênios, dadas as posições dos átomos pesados. Mas para responder à pergunta - em MD, na maioria das vezes é necessário adicionar hidrogênios em todos os lugares, não apenas nos grupos tituláveis, porque a estrutura inicial do PDB não tem nenhum hidrogênio. Na verdade, muitas vezes as estruturas do PDB têm falta de espinha dorsal pesada ou átomos da cadeia lateral, porque eles não puderam ser resolvidos; às vezes faltam os terminais, às vezes grandes extensões de proteína; estes freqüentemente precisam ser modelados.


Visualizando a Dinâmica de Proteínas

00: 00: 07.06 Eu sou Dorothee Kern e hoje quero expor você ao tópico da dinâmica de proteínas na biologia.
00: 00: 15.22 O movimento da proteína, a mudança das coisas ao longo do tempo, é uma característica fundamental do biológico
00: 00: 23,03 função e, na verdade, vida.
00: 00: 25.00 Desde que eu era um estudante de graduação, minha grande visão tem sido ser capaz de observar proteínas em
00: 00: 31,27 em tempo real com resolução atômica, como posso mostrar à direita. agora, aqui, chegando no
00: 00: 39.09 Filme em tempo real de, por exemplo, uma enzima fazendo catálise.
00: 00: 42,22 Mas por que você deveria se preocupar com a dinâmica das proteínas?
00: 00: 47.06 Deixe-me usar uma analogia macroscópica para ilustrar por que temos que ir além do snap estático.
00: 00: 53,23 instantâneos para compreender a função biológica.
00: 00: 56.20 Desta pequena foto aqui, você não conhece o meu jogo.
00: 01: 02.06 Então, você não sabe se a bola entra.
00: 01: 05.02 Mas, macroscopicamente, assistir a ação é muito simples - basta comprar uma câmera de vídeo.
00: 01: 11.08 No entanto, isso não é possível em um nível microscópico.
00: 01: 16.21 Na verdade, o que quero dizer é que a dinâmica macroscópica da proteína está realmente enraizada no
00: 01: 22,21 dança microscópica de pequenos átomos individuais.
00: 01: 26.10 E o que eu gostaria de fazer hoje é mostrar como a dinâmica da proteína está ligada a
00: 01: 30.24 função biológica, e quais técnicas biofísicas - as técnicas biofísicas mais proeminentes -
00: 01: 35.05 você pode usar para visualizá-lo.
00: 01: 37,27 Se você continuar fazendo a pergunta, como funcionam as proteínas ?, você chega ao nível de resolução atômica,
00: 01: 44.21 os menores blocos de construção da biologia.
00: 01: 49.04 A biologia estrutural revolucionou nossa compreensão das proteínas neste nível atômico.
00: 01: 57.07 No entanto, eu diria que essas belas estruturas que mostro não vão te dizer
00: 02: 01.26 como eles funcionam.
00: 02: 06.01 O que meu laboratório fez nos últimos anos foi adicionar a quarta dimensão à biologia estrutural
00: 02: 11,20 para observar diretamente as proteínas em ação.
00: 02: 14.12 Então, acabei de mostrar a vocês uma pequena visão geral, aqui, do tipo de trabalho que fazemos. temos trabalhado.
00: 02: 20,24 Por exemplo, no primeiro, ali, você realmente vê uma proteína sinalizadora.
00: 02: 26.13 E ao contrário da imagem do livro que você pensa, a proteína está no estado inativo
00: 02: 32.15 e então fica, por exemplo, fosforilado e muda para uma estrutura ativa,
00: 02: 36.25 o que descobrimos é que, na verdade, a proteína oscila constantemente para frente e para trás, pula entre
00: 02: 42.07 os dois estados, e por isso é uma imagem muito diferente de como a sinalização realmente funciona.
00: 02: 49,08 Lá embaixo, posso mostrar outro exemplo de como. como visualizamos como um
00: 02: 55.06 transportador multi-drogas transporta drogas que você acabou de colocar na célula,
00: 03: 01.05 de dentro para fora, através de uma mudança conformacional constante.
00: 03: 06.20 Até questões como neurobiologia, por exemplo, memória de longo prazo, que estou a mostrar.
00: 03: 12.04 mostramos aqui, pode ser explicado pelas interações dinâmicas entre uma enzima que
00: 03: 19.08 estudando e um receptor no cérebro.
00: 03: 22.06 Esta, por exemplo, foi uma história bastante interessante em que trabalhamos com a dependência de cocaína
00: 03: 26,28 em. em ratos.
00: 03: 29,26 Do lado direito, ali, você vê que para as interações proteína / proteína é de novo.
00: 03: 36.27 não é um dock de corpo rígido, mas as interações proteína / proteína são mediadas por uma interação dinâmica
00: 03: 42,10 entre os dois jogadores.
00: 03: 44,05 E mesmo. por último, para a ligação de drogas, que era. você sabe, o dogma é que é.
00: 03: 50.28 esta pequena molécula apenas se fixa em uma proteína e inibe, nós mostramos que o
00: 03: 55.15 O componente crucial para o design racional de medicamentos é, na verdade, a dinâmica das proteínas.
00: 04: 00.06 Então, depois que eu te deixei provavelmente já tonto parecendo. vendo todos esses filmes, é melhor eu
00: 04: 05.24 para dizer como estamos realmente chegando a isso. nesses filmes quadridimensionais.
00: 04: 13.12 Mostro aqui uma coleção de métodos biofísicos que nos permitem ver o invisível.
00: 04: 19.11 E eu chamo de invisível porque é claro que você não pode observar átomos individuais sob um microscópio,
00: 04: 24.04 com certeza não está dançando em tempo real. em suas diferentes escalas de tempo.
00: 04: 28.19 Portanto, mencionarei alguns desses métodos na minha palestra.
00: 04: 33.24 O que mostro, por exemplo, é a espectroscopia de NMR, que significa ressonância magnética nuclear,
00: 04: 39.11 que é o nosso método comum, e eu diria que é um dos melhores métodos para medir
00: 04: 43,26 movimentos sobre uma resolução atômica.
00: 04: 45.18 Combinamos isso com espectrometria de massa, cristalografia de raios-X, muito agora.
00: 04: 53.23 experimentos cinéticos antiquados, por exemplo, experimentos de fluxo interrompido e fluxo extinto,
00: 04: 59,11 e. ou experimentos de fluorescência de molécula única e transferência de energia.
00: 05: 03.11 Muito recentemente, também temos usado a bioinformática, que apresento aqui embaixo, para análise
00: 05: 11.19 a evolução da função da proteína.
00: 05: 15.03 E, finalmente, todos esses métodos experimentais estão sendo combinados com computação,
00: 05: 20.01 que, claro, desempenha um papel muito importante para finalmente criarmos as nossas moléculas dançantes.
00: 05: 28.18 Essas moléculas dançantes são divertidas de assistir, mas temos que encontrar uma linguagem unificadora para
00: 05: 37.04 descrevem nossos sistemas biofísicos, neste caso, nossas proteínas.
00: 05: 40.26 E a linguagem unificadora que é inequívoca, esteja você morando na Índia, na China ou
00: 05: 46.22 América ou Austrália é, na verdade, o cenário de energia livre.
00: 05: 51.14 Tenho certeza que você já ouviu falar.
00: 05: 53.12 A energia livre dos sistemas.
00: 05: 56.02 E então o que mostro aqui é provavelmente uma das coisas-chave para a palestra.
00: 06: 00.19 E por que você realmente quer prestar atenção nas aulas de físico-química.
00: 06: 06.13 Se você tem uma proteína que, por exemplo, se interconverte entre dois estados diferentes,
00: 06: 11,24 por exemplo, estado A e estado B, que podem ser os estados inativo e ativo, para descrever
00: 06: 17.07 todo o sistema queremos fazer três coisas.
00: 06: 19,17 Queremos descobrir as populações entre os estados, e então o que você vê na verdade.
00: 06: 25.12 que, claro, na paisagem de energia, um estado é definido como um mínimo no
00: 06: 31.24 paisagem de energia livre, aqui e ali.
00: 06: 35.27 A interconversão, ou seja, ir do estado A para o estado B,
00: 06: 39,23 está passando pelo estado de transição.
00: 06: 42.19 Assim, no cenário de energia, o estado de transição é definido como este ponto de sela e
00: 06: 48.22 o ponto alto da paisagem de energia livre.
00: 06: 51.16 Então, o que eu descrevi agora são os dois principais estados.
00: 06: 54.24 Nós os chamamos de estados cineticamente distintos porque eles são separados por uma grande energia livre
00: 07: 00.01 barreira.
00: 07: 01.02 E como você sabe, há. a altura da barreira de energia livre que define
00: 07: 04,22 a taxa de interconversão.
00: 07: 06.06 Barreira grande significa lento.
00: 07: 08.01 Pouca barreira significa rápido.
00: 07: 09.18 Então, quando descemos do nível 0 para o nível 1, é claro que também temos níveis menores.
00: 07: 16.06 ali, temos realmente menores. barreiras menores, o que significa que essas interconversões
00: 07: 21.21 são mais rápidos, por exemplo, na escala de tempo de nanossegundos.
00: 07: 24.13 Nós os chamamos de nível 1.
00: 07: 26.01 E ainda mais abaixo temos mais microestados, que podem ser centenas de milhares
00: 07: 31,12 dentro desse estado A, que estão se interconvertendo na escala de tempo de picossegundos.
00: 07: 34.26 E nós os chamamos de subestados entrópicos.
00: 07: 38.24 E, finalmente, se quiser realmente descrever completamente os sistemas, gostaríamos de saber
00: 07: 42.10 as estruturas de todos esses instantâneos e as estruturas que estão sendo amostradas.
00: 07: 48.21 Então, esse é realmente o objetivo do quadro geral, porque se você pode descrevê-lo. nosso sistema desta forma,
00: 07: 52.26 entendemos perfeitamente.
00: 07: 57.07 Agora, que tipo de movimento pertence a essas escalas de tempo de picossegundos / nanossegundos / [microssegundos]?
00: 08: 04.08 As escalas de tempo muito rápidas, se você aprendeu com. em química, são realmente vibrações de ligação.
00: 08: 10.00 Passando de femtossegundos para picossegundos e nanossegundos, entramos em rotações de
00: 08: 16.09 ligações simples, movimentos de loop e rotações de sidechain.
00: 08: 19.17 E, finalmente, indo até milissegundos, segundos ou talvez até horas,
00: 08: 23.06 estamos falando sobre movimentos muito coletivos de muitos átomos juntos.
00: 08: 27.14 A última questão, agora, é, que tipo de métodos poderiam ser usados?
00: 08: 32.20 Então, eu identifiquei alguns métodos, que você pode ver são usados ​​para descrever diferentes escalas de tempo
00: 08: 39.25 de movimentos, aqui.
00: 08: 41.02 E isso fará, agora, parte da palestra, para explicar como usar esses métodos para
00: 08: 46.27 descobrir movimentos nessas escalas de tempo diferentes.
00: 08: 49.17 Para o resto da palestra, para ser realmente, tipo, prático, estou escolhendo
00: 08: 57.04 para descrever como estudar os movimentos das proteínas e como os movimentos estão ditando a função biológica
00: 09: 04.25 em um sistema, que é o poder catalítico das enzimas durante a catálise.
00: 09: 09.08 Sempre me intrigou como as enzimas são incríveis em seu poder catalítico.
00: 09: 15.08 Esta enzima, por exemplo, é uma enzima absolutamente essencial em todas as células de todos os organismos
00: 09: 20,24 porque contr. catalisa a interconversão entre ATP e AMP em moléculas de ADP.
00: 09: 28.15 Então, por que essa reação é tão essencial para todas as células?
00: 09: 31.17 Ele contém. ele mantém as concentrações corretas de nucleotídeos na célula.
00: 09: 38.00 Você pode não saber, mas se sua concentração de ATP na célula cair abaixo de 1 milimolar,
00: 09: 42,07 você está morto.
00: 09: 43,17 Então, essa reação, sem a enzima, levaria 7.000 anos.
00: 09: 47,27 A enzima pode completar essa reação química em 10 milissegundos.
00: 09: 52,24 Então, esse é, realmente, o poder fascinante das enzimas.
00: 09: 56.13 E estamos longe de entender como essas proteínas sofisticadas podem fazer isso.
00: 10: 01.28 Então, agora, o que os cientistas fizeram até agora?
00: 10: 04.13 A forma tradicional de descrever poderes enzimáticos é usando, na verdade, números de turnover
00: 10: 10.04 - a rapidez com que a enzima está girando sobre um substrato - ou, por exemplo, uma constante de Michaelis-Menten,
00: 10: 14.26 que é realmente a afinidade da proteína e do substrato.
00: 10: 19.22 O que eu queria fazer - e isso era uma espécie de, você sabe, sonho desde que eu era um estudante -
00: 10: 23,26 foi assistir a enzima em ação em resolução atômica, meio que mostrado com aquele pequeno
00: 10: 29.01 desfoque de. do. do. da foto, aqui.
00: 10: 33,07 Então, como vamos chegar lá?
00: 10: 34.20 Eu disse que o próximo passo é que temos que descobrir o cenário da energia livre.
00: 10: 40,26 Antes de fazermos isso, é claro que eu disse a você, temos que descrever todos os estados.
00: 10: 44.15 Para descobrir quais estados são realmente amostrados durante a catálise, uma etapa muito importante
00: 10: 50.15 é passar de uma enzima para realmente colocar no esquema da reação.
00: 10: 57,26 E para o esquema, pretendo anotar todos os estados que podemos imaginar que a enzima é
00: 11: 03,27 amostragem.
00: 11: 04.27 Então, o que você vê aqui, a enzima, a enzima livre ali, pode combinar substratos.
00: 11: 13,25 Ele tem que ligar, na verdade, dois substratos, ATP e AMP, para formar o complexo ternário.
00: 11: 18.21 Então esta enzima pode fazer mudanças conformacionais.
00: 11: 21.13 Então a química acontece.
00: 11: 23.00 Em seguida, outra mudança conformacional.
00: 11: 24.13 E então, finalmente, os substratos precisam ser liberados.
00: 11: 26.16 Então, sobre isso, você sabe, apenas 20 quiloDalton de proteína, vai ter uma amostra de pelo menos 10
00: 11: 34,24 etapas microscópicas.
00: 11: 36.10 Agora, a partir deste esquema, finalmente. queremos realmente chegar a uma conclusão
00: 11: 42.06 as populações relativas e as taxas de conversão de estruturas,
00: 11: 44.28 que seria o cenário de energia livre.
00: 11: 48.12 O primeiro método que quero apresentar é a espectroscopia de NMR, não apenas porque é
00: 11: 52,24 perto do meu coração, porque. mas acho que é realmente o método único de observar cada átomo
00: 11: 59,19 na proteína fazendo sua função, dançando.
00: 12: 03.02 E a razão é porque podemos descobrir todo o intervalo de tempo dos movimentos de picossegundos
00: 12: 09.08 até horas, apenas escolhendo os métodos corretos - abaixo, aqui -
00: 12: 14.07 em nossa caixa de ferramentas NMR.
00: 12: 17.06 Eu disse que podemos medir o canto.
00: 12: 19.06 cada átomo em uma proteína.
00: 12: 21.11 Outra coisa única é que podemos realmente medir as coisas em equilíbrio.
00: 12: 25.05 Então, em muitos outros métodos espectroscópicos, você tem que perturbar o equilíbrio e você está
00: 12: 30.00 observando como você está se reequilibrando, versus em NMR você pode realmente medir o equilíbrio.
00: 12: 35.11 E o mais importante, eu diria, podemos medir em condições fisiológicas.
00: 12: 39,04 Podemos mudar a temperatura, o pH, a concentração do substrato.
00: 12: 43.24 Estamos em solução e tendo nossa proteína fazendo o que é. o que quer fazer e, enquanto
00: 12: 49.13 está fazendo sua função, assistindo.
00: 12: 51.15 É por isso que realmente acho que é um método muito poderoso para a dinâmica de proteínas.
00: 12: 57.08 Então, qual é a física por trás disso?
00: 12: 59.28 Pensei em compará-lo a um método, que tenho certeza que todo mundo já encontrou,
00: 13: 06.17 que é a ressonância magnética, onde, se você tiver, por exemplo, uma lesão,
00: 13: 11.11 todo o seu corpo é empurrado em um grande ímã para ver que tipo de lesão, por exemplo,
00: 13: 17,10 você tem no. no. no joelho.
00: 13: 19.04 Então, é um método de imagem.
00: 13: 20.17 Acontece que usamos exatamente o mesmo método para ressonância magnética nuclear, exceto que
00: 13: 25.21 não colocamos um corpo inteiro lá para o tecido da imagem, mas sim nossas proteínas individuais
00: 13: 30.26 que queremos realmente assistir. observe, ou olhe para cada átomo.
00: 13: 35.11 Então, a frequência de excitação está nos comprimentos de onda do rádio, o que significa que você pode realmente
00: 13: 41,28 ouça a excitação dos átomos individuais, que vou mostrar agora.
00: 13: 54,27 Então, o que você acabou de ouvir foi, na verdade, a decadência da indução livre, a liberação do.
00: 14: 02.13 das energias do comprimento de onda na onda de rádio de um único átomo.
00: 14: 06.04 Mas, claro, uma proteína, aqui, consiste em milhares de átomos.
00: 14: 11.03 E gostaríamos de assistir ou ouvir cada átomo.
00: 14: 15.10 Então, para isso, podemos excitar todos os átomos nesta proteína e registrar suas frequências,
00: 14: 20,28 que são diferentes.
00: 14: 22.07 Por exemplo, aqui eu mostro um próton-nit. um espectro correlacionado próton-nitrogênio.
00: 14: 26,28 Então, cada ponto aqui pertence a uma amida na sua proteína.
00: 14: 31.02 É uma assinatura com uma frequência única.
00: 14: 34.05 Então, agora podemos ouvir a ressonância da proteína inteira, que irei tocar agora.
00: 14: 50.10 Soa exatamente como uma música?
00: 14: 52.22 Então, isso é um pouco da física por trás, certo ?, para descobrir em quais frequências ele ressoa.
00: 14: 57,24 Mas agora você quer descobrir o quão rápido eles dançam.
00: 15: 00.17 Então, temos que fazer mais um truque para nossos spins, ou nossos núcleos.
00: 15: 04.17 Então, o que vamos fazer é registrar o relaxamento desses spins de
00: 15: 10.04 um estado de excitação.
00: 15: 11.22 E decidi, de novo, colocar uns desenhos animados no topo, aqui, para os biólogos e depois
00: 15: 17.26 algumas pequenas equações para a física, aqui embaixo.
00: 15: 21.16 Então, vamos comparar nossos giros com os dos corredores.
00: 15: 24.02 Se realmente os colocarmos no estado de excitação, o que realmente faremos. nós os colocamos no
00: 15: 29.16 estádio na linha de partida e eles estão todos juntos começando, correndo ao redor do
00: 15: 34.04 estádio no seu. esses. essas frequências você apenas coração.
00: 15: 36.27 Eles estão juntos, então eles estão em ressonância - é assim que você chama na física.
00: 15: 41.00 Mas, o tempo todo, alguns correrão mais rápido e outros mais devagar.
00: 15: 45.00 E é esta defasagem no nosso estádio que chamamos de relaxamento transversal.
00: 15: 50.02 E a velocidade desse relaxamento nos diz diretamente sobre a rapidez com que essas proteínas se movem.
00: 15: 56.27 E eu mostrei a você, é claro, que essas são decaídas exponenciais únicas para as pessoas
00: 16: 00.22 que gostam, na verdade, de física.
00: 16: 01.28 E para que possamos medir isso.
00: 16: 03.22 Mais uma coisa que temos que fazer com nossos corredores, não queremos apenas dizer, ok, esses átomos
00: 16: 08,27 estão se movendo.
00: 16: 09.27 Na verdade, queremos descrever nosso cenário de energia livre.
00: 16: 12,07 Lembre-se, o que nós. qual era o nosso objetivo, descobrir as populações relativas,
00: 16: 17.00 a taxa de interconversões e fornece informações estruturais.
00: 16: 21.05 E muito, muito emocionante, o laboratório Palmer, agora. opa, quase 20 anos atrás, descobri
00: 16: 29.05 mais um truque que podemos fazer aos nossos corredores.
00: 16: 30.24 Eu disse que eles estão correndo em velocidades diferentes.
00: 16: 33.21 Se nós agora, durante este tempo de relaxamento, virarmos os corredores, para que Bolt, que era o mais rápido,
00: 16: 39,26 será o último, e o último será o rápido. será o mais rápido,
00: 16: 44.18 na verdade, eles vão terminar no estádio ao mesmo tempo.
00: 16: 47.18 E o que chamamos isso em física, estamos reorientando nossos pulsos.
00: 16: 51.13 E é este truque extra, onde realmente reorientamos o nosso. nosso relaxamento no plano XY,
00: 16: 56.22 que nos permite obter tudo isso. todas as informações de que precisamos sobre os prazos,
00: 17: 03.27 as populações e as informações estruturais.
00: 17: 06.02 Tudo bem.
00: 17: 07.02 Acho que sobrecarreguei você, talvez, com um pouco demais de RMN, mas eu só
00:17:11:10 fique animado com isso.
00: 17: 13.10 Vejamos alguns dados agora.
00: 17: 15.00 Meus pós-docs, Magnus e Vu, fizeram esses experimentos com esta enzima durante a catálise.
00: 17: 21.20 Eu disse que podemos observar a enzima durante a catálise.
00: 17: 24.13 Então, estamos colocando nossa enzima no tubo de RMN.
00: 17: 27.21 E assim que adicionamos substrato, ele realmente catalisa essa reação.
00: 17: 31.15 E acontece que, por ser uma reação totalmente reversível, vai durar para sempre.
00: 17: 37.00 Temos amostras que passaram por este ciclo enzimático por dois meses.
00: 17: 41,06 E enquanto. enquanto está fazendo seu trabalho, podemos medir esses tempos de relaxamento e, portanto,
00: 17: 46,24 obter informações sobre a dinâmica das proteínas.
00: 17: 49.08 Encontramos um resultado muito emocionante.
00: 17: 52.19 O que mostro aqui é que todos esses resíduos vermelhos, aqui, realmente parecem ser
00: 17: 58.09 movendo-se durante a catálise.
00: 18: 00.06 E o que descobrimos é que o que estamos realmente detectando é a abertura e o fechamento de
00: 18: 04.12 esta proteína, que eu mostro para vocês, aqui, no estado aberto e, aqui, no estado fechado.
00: 18: 09.06 E verifica-se que esta abertura e fechamento. o fechamento é muito rápido,
00: 18: 14.05 a abertura é bem mais lenta.
00: 18: 17.08 A abertura é de 40 por segundo.
00: 18: 19.06 Se compararmos agora essa constante de taxa com a rapidez com que esta enzima produz ATP, é na verdade
00: 18: 24.18 dentro do erro experimental.
00: 18: 25,24 Então, o que aprendemos foi a nossa primeira surpresa.
00: 18: 28.20 A etapa de limitação de taxa, a barreira mais alta no cenário de energia, é na verdade
00: 18: 32.28 não a etapa química de quebrar um fosfato e colocá-lo ali, mas sim uma grande
00: 18: 38.23 mudança conformacional de abertura e fechamento.
00: 18: 41.19 E acontece que este realmente parece ser um tema recorrente na biologia,
00: 18: 46.26 que muitas vezes a etapa limitante na biologia é, na verdade, a velocidade com que essas enzimas ou proteínas
00: 18: 53,01 sabe dançar.
00: 18: 54.21 Mas o objetivo dessa enzima não é dançar, mas realmente fazer
00: 18: 59,28 química, certo?
00: 19: 00.28 É nisso que a enzimologia clássica está se concentrando.
00: 19: 04.04 Como pode o profissional. a proteína pode receber ATP e AMP para fazer duas moléculas de ADP?
00: 19: 11,07 Então, quebre uma ligação fosfoanidrido e faça uma nova, certo?
00: 19: 14.01 Então, aqui temos as duas moléculas de ADP.
00: 19: 17.00 O motivo pelo qual é difícil de medir é porque não é a etapa limitadora da taxa.
00: 19: 20.24 E, não a etapa de limitação de taxa, é basicamente difícil. difícil de visualizar porque é muito rápido.
00: 19: 26.17 Então, a forma como resolvemos isso é que usamos um método diferente, cristalografia de raios-X.
00: 19: 31.00 Então, você poderia argumentar, cristalografia, você está congelando o cristal, é um mecanismo estático.
00: 19: 36,07 método.
00: 19: 37.07 No entanto, gravamos o cristal. muitos dados cristalográficos à temperatura ambiente.
00: 19: 42.17 E acontece que, à temperatura ambiente, as coisas ainda estão se movendo no cristal.
00: 19: 46.03 E o que mostrei aqui são duas moléculas de ADP no sítio ativo.
00: 19: 50.27 Um é a cor. muito colorido, porque cheira a uma molécula dinâmica.
00: 19: 56,27 Você vê a velocidade do fosfato?
00: 19: 59.10 Sobrepondo todas as nossas estruturas de cristal, parece. que este beta fosfato
00: 20: 04.20 é aquele que deseja voar para fazer ATP.
00: 20: 07.20 Coincidindo com esta flexibilidade que vemos no site ativo está esta arginina,
00: 20: 12.24 que parece agarrar o fosfato carregado negativamente para movê-lo.
00: 20: 16.15 Assim, embora a cristalografia tenha a reputação de ser um método estático, na verdade podemos ficar bastante
00: 20: 22.10 muita informação dinâmica.
00: 20: 24.02 Então, este estado aqui é na verdade o nosso complexo enzima-substrato.
00: 20: 30.08 Agora, é claro, você gostaria de saber como está realmente fazendo a reação para passar
00: 20: 34.08 o estado de transição.
00: 20: 35.13 O estado de transição não é povoado, porque está no topo do cenário energético.
00: 20: 39.22 Então, a próxima coisa que podemos fazer é tentar imitá-lo com um estado de transição analógico,
00: 20: 44.16 que estou mostrando aqui.
00: 20: 46.04 Então, uma molécula de ADP, um fluoreto de magnésio / alumínio e uma molécula de AMP está imitando
00: 20: 54.03 exatamente quando este beta fosfato está tentando voar de um. um passo para o outro.
00: 20: 59.00 E assim Young-Jin finalmente conseguiu obter esta estrutura de cristal de alta resolução.
00: 21: 03.24 E o que você vê é que o fluoreto de magnésio / alumínio, que imita o fosfato no
00: 21: 09.17 estado de transição, está diretamente no meio entre o doador e o aceitador.
00: 21: 14.07 Então, isso nos dá instantâneos, mas ainda não a dinâmica.
00: 21: 18.03 Deixe-me apresentar a você um método diferente, que nos dará informações mais dinâmicas.
00: 21: 24.05 Então, essa é a transferência de energia de fluorescência de molécula única resolvida no tempo.
00: 21: 30.23 Foi uma colaboração muito divertida com meu irmão mais novo, Christian, e sua aluna, Maria,
00: 21: 37.21 e meu pós-doutorado, Kathi.
00: 21: 40.16 E é sempre bom ter um irmão mais brilhante no. na família.
00: 21: 45,27 Então, liguei para o meu irmão, disse, sabe, temos que medir essa proteína enquanto fazemos
00: 21: 51.19 sua reação, e é um evento raro, então preciso da sua ajuda.
00: 21: 55.12 E então a ideia de um experimento de transferência de energia de fluorescência de uma única molécula é como um
00: 21: 59,26 régua espectroscópica.
00: 22: 01.17 Você está excitando o doador de fluorescência, e esta energia é transferida para o aceitador
00: 22: 08.16 apenas quando os dois, doador e aceitador, estão muito próximos.
00: 22: 12,09 Então, é uma régua diretamente espectroscópica.
00: 22: 14.15 Então, se excitarmos o corante verde e tivermos muita fluorescência no vermelho,
00: 22: 21.09 sabemos que eles estão próximos, mas se você conseguir muito pouco aqui, eles estão mais distantes.
00: 22: 25.27 Então, podemos fazer isso no nível de uma única molécula.
00: 22: 28.16 Podemos anexar, bem aqui, uma única molécula de enzima em uma lâmina de capa e assistir em
00: 22: 36,24 em tempo real a correlação de fluorescência vermelha e verde.
00: 22: 44,17 Então, novamente, longe significa.
00: 22: 46.14 Quer dizer, se houver muito pouca transferência, eles estão longe.
00: 22: 49.21 E se eles estão próximos, eles estão próximos. eles estão se aproximando.
00: 22: 53.17 Então, este é o experimento mental.
00: 22: 55.20 E agora estou mostrando os dados reais.
00: 22: 59.09 E aqui é onde a nossa próxima grande surpresa foi encontrada.
00: 23: 03.21 Medimos primeiro, na verdade, a enzima, a enzima feliz na presença de magnésio.
00: 23: 09,26 I para. meio que esqueci de mencionar para você - eu mostrei a você na estrutura -
00: 23: 13.16 mas acontece que o magnésio é muito essencial para a catálise das quinases.
00: 23: 18.14 E foi subscrito. descreveram que o magnésio é essencial para essa etapa química, a fosfotransferência,
00: 23: 24.17 certo ?, quando o fosfato vai de uma etapa para a outra.
00: 23: 27,01 Então. mas aqui estamos medindo a abertura e o fechamento da enzima, certo?
00: 23: 32.13 Então, se a transferência de energia fluorescente é eficiente, perto de 1, ali,
00: 23: 38.17 estamos no estado fechado.
00: 23: 40.17 E se estiver mais longe, temos uma transferência de fluorescência muito ineficiente.
00: 23: 44.10 Então, o que você pode ver é que em tempo real, dentro de milissegundos, esta enzima está abrindo
00: 23: 48.18 e fechamento.
00: 23: 49,27 Mas veja o que acontece quando você tira o magnésio.
00: 23: 52.20 Pensamos, se você tirar o magnésio, apenas a etapa química, que é apenas a
00: 23: 56.16 o movimento de um fosfato por um Angstrom é interrompido.
00: 23: 59.08 Mas, na verdade, parece que agora a abertura e o fechamento estão mais lentos
00: 24: 04.28 três ordens de magnitude, porque se você olhar para aquela escala de tempo, aqui, você vai ficar
00: 24: 08.25 no estado fechado por vários segundos.
00: 24: 11.15 Como pode ser isso?
00: 24: 12.15 A literatura está errada?
00: 24: 13.20 Então, como estávamos tão intrigados com esse resultado, o magnésio é realmente muito essencial
00: 24: 19.06 para a dinâmica de proteínas, projetamos outro método, um experimento baseado em
00: 24: 24.15 um novo método, que quero apresentar agora.
00: 24: 28.01 Chama-se cinética de quench-flow.
00: 24: 29.28 Então, o que podemos medir é um único turnover de uma proteína, por exemplo, uma enzima,
00: 24: 36.08 em que está fazendo sua primeira rotação.
00: 24: 38,24 É um método de mistura rápido, então estamos usando nossa enzima aqui, misture com a.
00: 24: 43.14 com um substrato muito rapidamente, e a reação vai.
00: 24: 47.01 Então, em uma segunda etapa, podemos extinguir a reação e, em seguida, coletar dados para. uma amostra
00: 24: 54.11 para análise de dados.
00: 24: 55.15 Então, o que isso nos permite?
00: 24: 57.05 Permite-nos olhar para a fosfotransferência, aqui, no primeiro turnover, e medir
00: 25: 03.16 esta etapa, embora a etapa posterior possa ser mais lenta.
00: 25: 07.16 Então, poderíamos descobrir o quão rápido esta fosfotransferência rápida está na primeira rotação.
00: 25: 13,02 Tudo bem.
00: 25: 14.02 Então, isso é o que eu mostro, os dados que mostro a seguir.
00: 25: 17.25 E aqui estão as boas e as más notícias.
00: 25: 19.28 A boa notícia é que a experiência funcionou e a enzima é muito rápida para a sua fosfotransferência.
00: 25: 26.17 A má notícia é que é muito rápido para ser pego, porque o que você pode ver aqui,
00: 25: 32.02 dentro do tempo morto do experimento, cerca de 50 milissegundos, toda a enzima foi convertida
00: 25: 38,26 ADP para ATP.
00: 25: 41.17 Então, nosso método é, na verdade, limitado no tempo.
00: 25: 44.09 Então, em outras palavras, a natureza aperfeiçoou a etapa química para ser super rápida, certo?
00: 25: 51.15 E então o que você vê aqui são múltiplas reviravoltas, agora.
00: 25: 54.07 Essa é a abertura lenta da enzima.
00: 25: 56.17 Então, o que acontece quando você tira o magnésio?
00: 25: 59.20 Lembre-se do que a experiência de uma única molécula FRET nos mostrou, que a abertura é muito lenta.
00: 26: 04.25 Mas o que acontece com a etapa química?
00: 26: 06.19 Novamente, vemos uma explosão, que é a etapa de fosfotransferência seguida pela abertura lenta.
00: 26: 13.25 Sim, a abertura é muito lenta, mas agora você vê que também a fosfotransferência, que estourou.
00: 26: 19.02 aquela primeira explosão também é muito lenta.
00: 26: 21.12 Então, o que aprendemos é realmente uma coisa muito surpreendente, o que a natureza faz.
00: 26: 27.13 Em primeiro lugar, posso dizer por que você tem que comer magnésio.
00: 26: 31.15 Não sei o que significa magnésio transformado em bio - você descobre isso.
00: 26: 35.26 Mas o que aprendemos é que a natureza é tão eficiente ou inteligente que usa um
00: 26: 43,26 átomo único para catalisar todas as etapas essenciais em toda a reação.
00: 26: 49,18 Pense nisso. um único átomo está fazendo todo esse trabalho.
00: 26: 52,27 Só pode fazer isso quando está ligado à enzima.
00: 26: 55.18 Acelera a etapa de fosfotransferência em mais de cinco ordens de magnitude
00: 27: 01.25 em relação à taxa não catalisada.
00: 27: 03.01 Mas, ao mesmo tempo, é o mesmo magnésio que catalisa a mudança conformacional
00: 27: 08.21 por três ordens de magnitude.
00: 27: 10.00 Então, eu chamaria isso de clandestinidade de um único átomo em uma enzima.
00: 27: 15.12 Você, sendo curioso, pode fazer a pergunta, como um único átomo pode fazer isso?
00: 27: 22.01 E, para isso, tentamos fazer alguns experimentos inteligentes.
00: 27: 26.08 Então, a primeira coisa que fizemos foi substituir o magnésio por outros cátions divalentes.
00: 27: 30.10 E o que aprendemos é, fazendo experimentos cinéticos com enzimas, que a taxa da química é
00: 27: 36.28 significativamente mais lento para todos os outros cátions divalentes. cátions.
00: 27: 40.17 Então, a natureza otimizou a etapa química, realmente, para o magnésio.
00: 27: 45.19 Em contrapartida, a mudança conformacional, que foi a nossa nova surpresa, também é essencial
00: 27: 51.14 para esta reação, é realmente independente de qual metal divalente você usa, o que significa
00: 27: 57.04 parece ser apenas um efeito eletrostático puro.
00: 27: 59,27 Então, esses são dados de NMR coletados em diferentes. com diferentes metais no sítio ativo.
00: 28: 05.03 O que me leva ao próximo método, que você deseja saber sobre o uso. para proteína
00: 28: 13.14 dinâmica, que são métodos computacionais.
00: 28: 16,22 Claro, no computador, você pode calcular tudo.
00: 28: 18,27 Então, a primeira coisa que vou mostrar a vocês é o cálculo do potencial eletrostático
00: 28: 24.17 no site ativo.
00: 28: 26.00 Você pode ver nossas duas moléculas de ADP, aqui e ali.
00: 28: 30.24 Você vê nossas argininas caindo.
00: 28: 32.22 As argininas, como você sabe, são carregadas positivamente, interagindo com os fosfatos carregados negativamente.
00: 28: 37.13 Eu disse que precisamos disso para a química, para mover o fosfato.
00: 28: 41.26 Mas, no final do dia, essas interações precisam ser quebradas para abrir a enzima para
00: 28: 47.01 liberam o substrato.
00: 28: 48.07 E lembre-se, essa é a nossa etapa de limitação de taxa.
00: 28: 50.20 Interações de carga muito fortes são muito, muito difíceis de quebrar.
00: 28: 53.20 Então, o que a natureza está fazendo?
00: 28: 55.11 É colocar outro magnésio com carga positiva no lado oposto deles. desta interação,
00: 29: 01.27 enfraquecendo assim as interações eletrostáticas.
00: 29: 04.05 Um mecanismo muito inteligente.
00: 29: 07.15 O que mais podemos fazer com métodos computacionais?
00: 29: 11.02 Uma das coisas mais famosas, claro, de que todos vocês já ouviram falar é
00: 29: 15.23 simulações de dinâmica molecular,
00: 29: 17.27 onde podemos finalmente conseguir essas danças. proteínas dançantes, o que parece muito.
00: 29: 22,18 muito. muito interessante.
00: 29: 23,27 O que é realmente o derivado. a física por trás disso?
00: 29: 26,23 Tudo o que vamos fazer é calcular as leis.
00: 29: 30.13 Leis de Newton do movimento entre os átomos.
00: 29: 33.06 Portanto, é uma descrição clássica do sistema.
00: 29: 36.14 E então o que lhes mostro aqui é na verdade a abertura e o fechamento da enzima,
00: 29: 41.02 essa etapa de limitação de taxa.
00: 29: 42.05 Há outra coisa que quero mencionar aí.
00: 29: 45.12 Também podemos visualizar, no computador, moléculas individuais de água, que é claro
00: 29: 50.26 não pode fazer em um experimento.
00: 29: 52.13 E isso me respondeu uma pergunta muito intrigante.
00: 29: 57.02 Minha pergunta realmente tem sido, como essa enzima pode fazer fosfotransferencia com eficiência, mas
00: 30: 03.20 evitar a hidrólise, qual é a reação energeticamente favorável?
00: 30: 07.08 E acontece que, se você pensar sobre enzimas, a coisa mais difícil é realmente suprimir
00: 30: 13,19 reações energeticamente favoráveis, e não para catalisar a reação que você deseja.
00: 30: 18,26 E a reação preferida, de longe, é a hidrólise.
00: 30: 20.24 Eu disse a você que se hidrolisarmos nosso ATP, morreremos em um minuto.
00: 30: 24,22 Então, esta enzima tem que ser extremamente boa em suprimir a hidrólise.
00: 30: 29.12 Eu pensei que o que vai acontecer é que vai tirar todas as águas
00: 30: 33,21 do site ativo.
00: 30: 34,22 Mas não é isso que acontece.
00: 30: 36.09 Todas essas bolinhas aqui, são todas moléculas de água bem na cavidade de
00: 30: 40.20 o site ativo.
00: 30: 42.11 Como está evitando a hidrólise?
00: 30: 45.00 Na verdade, ele mantém as moléculas de água longe o suficiente do fosfato que
00: 30: 50.15 não pode fazer hidrólise.
00: 30: 54.22 E, finalmente, usando cálculos da mecânica quântica, podemos observar diretamente a fosfotransferência
00: 31: 00.22 step, observe. você está quebrando, aqui, a ligação de fosfato, e você a coloca ali.
00: 31: 06.17 Claro, precisamos de cálculos de mecânica quântica porque temos que quebrar as ligações.
00: 31: 10.04 Então, isso é apenas dar a você, realmente, um sabor de que tipo de perguntas você pode responder
00: 31: 17,27 com métodos computacionais.
00: 31: 19.21 Claramente, os métodos de computação precisam ser combinados com experimentos.
00: 31: 23.12 Voltando, o que estamos mostrando aqui é como combinar um array, um realmente complementar
00: 31: 32.17 conjunto de métodos biofísicos, onde somos permitidos. onde somos capazes de descobrir
00: 31: 37.20 em um cenário de energia livre como essa enzima funciona.
00: 31: 40.14 E como está fazendo seu incrível poder de catálise.
00: 31: 43.13 No final, quero realmente chegar a algo que foi muito surpreendente.
00: 31: 49.16 As pessoas pensaram que se você tomar essas enzimas e elas não virem um substrato, elas são
00: 31: 54.04 basicamente descansando, eles estão dormindo. o que não é verdade.
00: 31: 56.28 Se você olhar, na verdade, para esta enzima no estado de sono, o que significa que não há substrato
00: 32: 02.12 vinculado, há muito movimento acontecendo.
00: 32: 04.22 E, de fato, os movimentos já estão imitando o que a enzima precisa fazer durante a catálise.
00: 32: 10.20 Então, o que estamos chamando é como se a personalidade dinâmica fosse construída. é construído
00: 32: 15.11 na enzima e está subjacente à catálise.
00: 32: 18.08 Então, deixe-me mostrar rapidamente como vimos que os movimentos que são de vital importância
00: 32: 23.23 para a catálise são realmente uma propriedade intrínseca da enzima.
00: 32: 27.09 Ali, mostro-lhes em vermelho, laranja e amarelo três estruturas que partem desta.
00: 32: 34.17 da adenilato quinase, desta quinase, no estado de repouso, o que significa que não há substrato ligado.
00: 32: 39,24 O que você pode ver é que as pálpebras já estão fechando parcialmente.
00: 32: 44.01 Então, o que tínhamos eram três moléculas na célula unitária assimétrica, e elas tinham estruturas diferentes.
00: 32: 49.27 E eles se moveram exatamente ao longo da trajetória onde deveria ir durante a catálise,
00: 32: 55.04 que é a estrutura verde.
00: 32: 56.11 Então, já existe um fechamento parcial, diretamente ao longo da direção para onde quer ir
00: 33: 02.08 durante a catálise.
00: 33: 03.22 Então, a questão é, claro, a cristalografia nos dá instantâneos, mas não escalas de tempo.
00: 33: 08.20 É por isso que as simulações de dinâmica molecular usaram para fazer a pergunta, qual é a escala de tempo
00: 33: 15.00 desse tipo de movimento?
00: 33: 16.12 E acontece que esses fechamentos parciais da tampa acontecem na escala de tempo de nanossegundos.
00: 33: 20.20 Tudo bem. exceto que fizemos muitos experimentos.
00: 33: 24.06 Na verdade, agora olhamos para esta enzima livre por espectroscopia de RMN que acabei de mostrar.
00: 33: 29.13 E o que descobrimos foi que há movimento na escala de tempo dos milissegundos.
00: 33: 33.15 Isso é ordens de magnitude mais lento.
00: 33: 34,27 Então, o que estamos perdendo?
00: 33: 37.13 Então, novamente, nossos experimentos FRET de molécula única responderam a essa pergunta, porque o que nós
00: 33: 41,27 podia ver. que, em tempo real, a enzima de fato está fechando totalmente, mas é muito mais lento.
00: 33: 48.00 Então, em outras palavras, você tem uma imagem em que tem um fechamento parcial em escala de tempo rápido,
00: 33: 54.25 e, em seguida, um evento raro, que é muito mais lento, de fechamento total.
00: 34: 02.26 O que me leva a isso. ao. para o início da minha palestra, para falar sobre o
00: 34: 08.27 hierarquia no espaço e no tempo.
00: 34: 10.21 O que quero dizer, a hierarquia no espaço no tempo?
00: 34: 12.11 Queremos ligar os movimentos lentos, aqui, aos movimentos rápidos.
00: 34: 17.18 E eles estão de fato ligados, ok?
00: 34: 20.02 Então, falei muito sobre experimentos para ver como passamos pela grande montanha, certo?
00: 34: 25.04 os movimentos lentos.
00: 34: 26.04 Mas que tal medir esses movimentos rápidos, aqui?
00: 34: 29.05 Para isso, podemos medir a velocidade de um vetor de ligação, mostrado aqui, um vetor de ligação de amida,
00: 34: 35.22 está realmente se mexendo.
00: 34: 37.19 E não só obtemos a escala de tempo, mas também a amplitude.
00: 34: 40.13 Então, medimos isso por NMR, novamente, isso agora é pico a nanossegundos, diminuindo
00: 34: 45,26 para esses movimentos mais rápidos.
00: 34: 48.04 E eu mostro esses dados como uma escala de cores contínua, azul significa que é um muito
00: 34: 54,27 pequena amplitude - então 1 significaria que não há. nenhuma mudança de amplitude e 0 seria
00: 35: 00.13 um movimento completamente isotrópico.
00: 35: 01.22 Então, o que você vê é que existem pontos de acesso, pontos de acesso dinâmicos.
00: 35: 06.21 Os vermelhos, certo?
00: 35: 07.21 Então, mais uma coisa que eu quero explicar para você, no lado esquerdo eu tenho dados sobre uma proteína mesofílica,
00: 35: 13.08 que teve. que vive. em ambientes normais e felizes, e no lado direito
00: 35: 18.19 é na verdade uma enzima hipertermofílica, que vive na natureza
00: 35: 23.20 nas aberturas quentes.
00: 35: 24.20 Então, o que acontece com esses pontos de acesso dinâmicos, aqui?
00: 35: 28.07 Acontece que estes são os meus cotovelos.
00: 35: 31.06 Estas são as dobradiças que precisam ser flexíveis para que minha tampa possa se mover.
00: 35: 35.16 Então, o que vemos são movimentos rápidos em escala de tempo no meu. no meu cotovelo, de modo que, na verdade,
00: 35: 40.25 minha mão pode se mover.
00: 35: 42.13 Portanto, movimentos rápidos na escala de tempo levam a movimentos lentos na escala de tempo.
00: 35: 47.11 Curiosamente, isso está diretamente ligado à atividade.
00: 35: 51.09 Porque se você olhar para as enzimas mesofílicas e termofílicas, bem, nós sabemos que termofílicas
00: 35: 55,27 enzimas em baixas temperaturas, a 20 graus, são muito ruins.
00: 35: 59.11 E a razão pela qual eles são lentos é porque eles são movimentos rápidos em escala de tempo em suas dobradiças,
00: 36: 04.20 eles ainda não são vermelhos e amarelos.
00: 36: 06.22 Eles não têm grandes amplitudes.
00: 36: 09.13 Mas veja o que acontece quando você atinge uma temperatura em que, agora, as atividades são combinadas.
00: 36: 17.02 As atividades daqui e daqui são combinadas.
00: 36: 21.01 E também a dinâmica do meu cotovelo.
00: 36: 24.06 Então, isso nos permite agora colocar, juntos, essa hierarquia no espaço de tempo de escala de tempo rápida
00: 36: 31.22 movimentos, mais localizados, levando a movimentos mais lentos de mudanças mais globais.
00: 36: 37.23 Claro, conhecendo as estruturas, podemos fazer a pergunta, o que dita o diferencial
00: 36: 42.13 flexibilidade nessas dobradiças?
00: 36: 44.26 E estou apenas mencionando duas coisas.
00: 36: 47.03 Um é o empacotamento de aromáticos - enrijecemos o termófilo embalando muitos aromáticos
00: 36: 52.08 juntos e, portanto, mantendo-os rigidamente juntos.
00: 36: 55.05 E o segundo truque que a natureza usa são as prolinas, porque as prolinas, como você sabe, são imidas
00: 37: 02.13 e restringir o backbone.
00: 37: 06.14 Para resumir o que gostaria que levasse para casa, espero ter estimulado o seu apetite
00: 37: 16.09 para ficar intrigado sobre a dinâmica das proteínas.
00: 37: 21.08 Voltando ao. para o início, não há vida sem dinâmica.
00: 37: 27,23 E, claro, o que está se movendo são os conjuntos estruturais.
00: 37: 30.26 Então, seja sinalização, transporte de membrana, neurobiologia, ligação de drogas, o que nós
00: 37: 38.00 precisa fazer é descobrir os cenários de energia livre dos sistemas para entender como os saudáveis,
00: 37: 44.06 proteínas felizes em nosso trabalho corporal.
00: 37: 46.23 E, finalmente, aplicar isso para fazer um design racional de medicamentos para intervir em doenças,
00: 37: 53.18 que será a segunda parte da minha série de palestras.
00: 37: 56.27 O slide mais importante é, claro, minha equipe.
00: 38: 01.08 Estou parando vocês aqui contando a história, mas na verdade esses são os caras que fizeram
00: 38: 06.08 todo o trabalho.
00: 38: 07.14 Minha equipe incrível em Brandeis.
00: 38: 09.07 E devo dizer, eles são a razão pela qual eu amo ir para o trabalho todas as manhãs.
00: 38: 13,06 Obrigado.


Resumo

Variantes no domínio da quinase TGFBR2 causam várias doenças humanas e podem aumentar a propensão ao câncer. A ampla aplicação do sequenciamento de próxima geração no contexto da Medicina Individualizada (IM) está aumentando a taxa na qual as variantes do domínio da quinase TGFBR2 estão sendo identificadas. No entanto, sua relevância clínica é frequentemente incerta. Consequentemente, procuramos avaliar o uso de modelagem molecular e simulações de dinâmica molecular (MD) para avaliar o impacto potencial de variantes dentro deste domínio. Documentamos as diferenças estruturais reveladas por esses modelos em 57 variantes usando simulações independentes de MD para cada uma. Nossas simulações revelaram vários mecanismos pelos quais as variantes podem levar a alterações funcionais, algumas são reveladas energeticamente, enquanto outras estrutural ou dinamicamente. Descobrimos que o local de ligação do ATP e a dinâmica do loop de ativação podem ser afetados por variantes em posições em toda a estrutura. Esta previsão não pode ser feita apenas a partir da sequência linear. Apresentamos nossas análises baseadas em estrutura juntamente com aquelas obtidas usando vários algoritmos preditivos baseados em genômica comumente usados. Acreditamos que as informações mecanísticas adicionais reveladas pela modelagem molecular serão úteis para orientar o exame de variantes clinicamente observadas em todo o exoma, bem como aquelas que provavelmente serão descobertas em um futuro próximo por testes clínicos que alavancam o sequenciamento de próxima geração por meio de esforços de IM.

Citação: Zimmermann MT, Urrutia R, Oliver GR, Blackburn PR, Cousin MA, Bozeck NJ, et al. (2017) Modelagem molecular e simulação dinâmica molecular dos efeitos de variantes no domínio da quinase TGFBR2 como um paradigma para a interpretação de variantes obtidas por sequenciamento de próxima geração. PLoS ONE 12 (2): e0170822. https://doi.org/10.1371/journal.pone.0170822

Editor: Freddie Salsbury Jr, Wake Forest University, ESTADOS UNIDOS

Recebido: 14 de outubro de 2016 Aceitaram: 11 de janeiro de 2017 Publicados: 9 de fevereiro de 2017

Direito autoral: © 2017 Zimmermann et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença de Atribuição Creative Commons, que permite o uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original e a fonte sejam creditados.

Disponibilidade de dados: Todos os dados relevantes estão no documento e nos arquivos de informações de apoio.

Financiamento: Agradecemos ao Mayo Clinic Center for Individualized Medicine pelo financiamento. RU foi apoiado por doações do NIDDK: Instituto Nacional de Diabetes e Doenças Digestivas e Renais - RO1 52913, - P30 084567 - P50CA102701 e da Fundação Mayo. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta e análise de dados, decisão de publicar ou preparação do manuscrito.

Interesses competitivos: Os autores declararam que não existem interesses conflitantes.


Resumo

O intervalo de tempo das simulações de dinâmica molecular atomística (MD) é determinado pelos movimentos mais rápidos no sistema e é normalmente limitado a 2 fs. Uma abordagem cada vez mais popular é aumentar a massa dos átomos de hidrogênio para ∼3 amu e diminuir a massa do átomo original em uma quantidade equivalente. Esta abordagem, conhecida como reparticionamento de massa de hidrogênio (HMR), permite intervalos de tempo de até 4 fs com estabilidade de simulação razoável. Embora o HMR tenha sido aplicado em muitos estudos publicados até o momento, ele não foi amplamente testado para sistemas contendo membrana. Aqui, comparamos os resultados das simulações de uma variedade de membranas e sistemas de membrana-proteína executados usando uma etapa de tempo 2 fs e uma etapa de tempo 4 fs com HMR. Para sistemas de membrana puros, não encontramos quase nenhuma diferença nas propriedades estruturais, como área por lipídio, perfis de densidade de elétrons e parâmetros de ordem, embora haja diferenças nas propriedades cinéticas, como a constante de difusão. A condutância através de uma porina em um campo aplicado, a partição de um pequeno peptídeo, a dinâmica da ligação de hidrogênio e a mistura da membrana mostram muito pouca dependência do HMR e do intervalo de tempo. Também testamos um corte de 9 Å em comparação com o corte CHARMM padrão de 12 Å, encontrando desvios significativos em muitas propriedades testadas. Concluímos que HMR é uma abordagem válida para sistemas de membrana, mas um corte de 9 Å não é.


Introdução

As estruturas tridimensionais das proteínas contribuíram para o conhecimento detalhado sobre os processos biológicos em nível molecular. Durante as últimas duas décadas, avanços em técnicas experimentais como cristalografia de raios X, RMN e microscopia crioeletrônica levaram à determinação de quase 170.000 estruturas de resolução atômica [1]. No entanto, o número de estruturas resolvidas ainda é muitas ordens de magnitude menor do que as 195 milhões de entradas de sequência no UniProt [2]. A previsão da estrutura computacional poderia preencher essa lacuna, mas os modelos com qualidade quase experimental são necessários para estudar as relações estrutura-função e permitir o design racional de drogas.

Numerosas abordagens computacionais para a previsão da estrutura da proteína foram desenvolvidas. Uma força motriz do desenvolvimento de métodos tem sido os experimentos de Avaliação Crítica de Predição de Estrutura de Proteínas (CASP). As avaliações CASP desafiaram a comunidade de pesquisa a prever as estruturas 3D das proteínas com base nas sequências de aminoácidos. Os modelos submetidos ao CASP são comparados com estruturas determinadas experimentalmente, que não estão disponíveis para os participantes durante a avaliação. Os resultados permitem comparações do desempenho dos métodos disponíveis e, assim, aferir o progresso no campo. Métodos de previsão de estrutura de proteína podem ser amplamente divididos em duas classes, com base em modelo (e.g. modelagem de homologia e reconhecimento de dobras) e ab initio (e.g. montagem de fragmentos e métodos baseados em física, também conhecidos como modelagem livre de template) [3]. Baseado em modelo e ab initio os modelos conterão erros (e.g. na estrutura secundária, empacotamento da cadeia lateral e regiões de loop) e precisam ser melhorados para serem úteis em aplicações que são sensíveis aos detalhes moleculares. Por esse motivo, há um interesse crescente em métodos que podem aprimorar a qualidade do modelo. No entanto, as avaliações CASP demonstraram que o refinamento do modelo é muito desafiador. No CASP8, 70% dos participantes em uma avaliação do refinamento da estrutura da proteína não conseguiram melhorar a concordância com os dados experimentais em comparação com os modelos iniciais [4]. Na última década, o acesso a mais poder computacional levou a um aumento do uso de métodos baseados na física, como simulações de dinâmica molecular (MD) e campos de força na previsão da estrutura de proteínas [5-9]. Enquanto os métodos baseados na física inicialmente tiveram um sucesso muito limitado no CASP, o desempenho melhorou em avaliações recentes. Na verdade, a simulação MD com campos de força baseados na física foi usada por oito dos dez métodos de refinamento de melhor desempenho no recente CASP12 e todos eles produziram uma melhoria média da precisão estrutural [10]. A melhoria consistente da qualidade do modelo com técnicas baseadas na física pode ter um grande impacto nos estudos da função da proteína e aumentar o poder preditivo do projeto de drogas com base na estrutura.

Duas áreas de pesquisa que geralmente não foram avaliadas pelas avaliações CASP são a previsão das estruturas das proteínas da membrana e o refinamento dos complexos proteína-droga. Quantas proteínas de membrana (e.g. canais iônicos e receptores acoplados à proteína G) são terapeuticamente relevantes [11,12] e a cobertura estrutural ainda é relativamente limitada para este grupo, há uma grande necessidade de abordagens de modelagem precisas. A utilidade dos modelos de proteínas no projeto racional de drogas dependerá de se as estruturas de complexos com ligantes podem ser previstas. As três avaliações de dock GPCR (GPCR Dock 2008, 2010 e 2013) [13-15] desafiaram a comunidade de pesquisa a prever estruturas de receptores acoplados à proteína G (GPCRs) em complexo com ligantes. Os resultados da primeira avaliação em 2008, que teve como foco a previsão da estrutura do A2A receptor de adenosina em complexo com um ligante antagonista, foram desanimadores. A grande maioria dos grupos de pesquisa participantes (93%) não conseguiu prever o modo de ligação do ligante com precisão (RMSD & gt 3 Å). Como esperado, as melhores previsões das estruturas do receptor nas três avaliações de GPCR Dock foram obtidas com modelagem de homologia e a precisão do modelo foi correlacionada com o quão intimamente relacionado o alvo estava com as estruturas de cristal GPCR disponíveis. No entanto, mesmo se os modelos com alta identidade de sequência estivessem disponíveis nas duas últimas avaliações, a previsão dos modos de ligação do ligante permaneceu um desafio. Na verdade, cerca de 60%, 80% e 70% dos grupos de pesquisa não conseguiram modelar o modo de ligação do ligante com precisão (RMSD & gt 3 Å) para o D3 dopamina, 5-HT1B serotonina e 5-HT2B receptores de serotonina, respectivamente. Nas avaliações de GPCR Dock, a predição dos complexos receptor-ligante foi tipicamente realizada com base em um modelo de homologia estática sem etapas de refinamento adicionais. Apenas alguns dos grupos de pesquisa participantes usaram refinamento MD para gerar os modelos (com base em métodos de apoio dos participantes da avaliação [13-15]) e o impacto do uso de simulações na precisão estrutural do complexo receptor-ligante não foi avaliado.

Neste estudo, avaliamos o uso de refinamento MD para melhorar modelos estruturais de GPCRs, modos de ligação de ligante e desempenho de triagem virtual. Simulações do D3 receptor de dopamina (D3R) em complexo com o ligante eticloprida, que foi um dos alvos do GPCR Dock 2010 [14], foram realizados para 30 dos modelos submetidos à avaliação.Dois protocolos baseados em diferentes campos de força foram usados ​​para gerar um tempo total de simulação MD de cerca de 60 μs. Instantâneos das trajetórias de simulação foram comparados com a estrutura cristalina do D3Complexo R-eticloprida [16] para determinar a precisão da região transmembrana (TM), loops, local de ligação e modo de ligação do ligante. Estratégias para melhorar os protocolos de refinamento de MD usando restrições nas simulações também foram exploradas. Vantagens e desvantagens de usar complexos GPCR-ligante refinados de MD foram analisadas com base em comparações com os modelos usados ​​como estrutura inicial, simulações da estrutura cristalina e o desempenho de triagem virtual dos modelos.


Resumo

O estudo atual fornece informações de que o surfactante estabiliza a conformação da ubiquitina em baixas temperaturas e altas concentrações de SDS. As análises de Rg e DSSP revelaram que a ubiquitina perde sua conformação nativa e adota uma estrutura de bobina aleatória ao longo de todo o tempo de simulação. Os resultados também sugeriram que as cargas atômicas parciais não só podem afetar o tipo e o nível de interações no complexo proteína-SDS, mas também podem mudar a orientação, distribuição e montagem das moléculas de SDS. Além disso, demonstramos que o surfactante SDS se agrega para formar uma estrutura semelhante a uma membrana e induz um desdobramento global na conformação da proteína em altas temperaturas. Este estudo demonstra que a manutenção da camada de hidratação desempenha um papel importante no mecanismo de desdobramento da ubiquitina. As simulações de MD também indicaram que nem as moléculas de SDS nem a temperatura podem ser usadas sozinhas para induzir o estado totalmente desdobrado na estrutura da proteína e ambas são necessárias. Acreditamos que essas descobertas podem ser úteis na bioquímica de proteínas, dobramento / desdobramento de proteínas e biologia estrutural. Além disso, o surfactante SDS pode imitar o ambiente biológico da membrana, e a investigação de suas interações com proteínas é de interesse no campo da biologia de membrana. Portanto, nossos resultados podem ser produtivos e úteis para quaisquer exames diretos de interações ubiquitina-membrana.


Anton, uma máquina de propósito especial para simulação de dinâmica molecular

A capacidade de realizar simulações de dinâmica molecular (MD) longas e precisas envolvendo proteínas e outras macromoléculas biológicas poderia, em princípio, fornecer respostas a algumas das questões mais importantes atualmente pendentes nos campos da biologia, química e medicina. Uma ampla gama de fenômenos biologicamente interessantes, no entanto, ocorrem em escalas de tempo da ordem de milissegundos, várias ordens de magnitude além da duração das simulações de DM atuais mais longas.

Descrevemos uma máquina massivamente paralela chamada Anton, que deve ser capaz de executar simulações clássicas de MD em escala de milissegundos de tais sistemas biomoleculares. A máquina, que está programada para ser concluída no final de 2008, é baseada em 512 ASICs específicos de MD idênticos que interagem de maneira fortemente acoplada usando uma rede de comunicação de alta velocidade especializada. Anton foi projetado para usar algoritmos paralelos inovadores e lógica de propósito especial para acelerar drasticamente os cálculos que dominam o tempo necessário para uma simulação típica de MD. O restante do algoritmo de simulação é executado por uma parte programável de cada chip que atinge um grau substancial de paralelismo enquanto preserva a flexibilidade necessária para acomodar avanços antecipados em modelos físicos e métodos de simulação.

1. Introdução

Simulações de dinâmica molecular (MD) podem ser usadas para modelar os movimentos de sistemas moleculares, incluindo proteínas, membranas celulares e DNA, em um nível atômico de detalhe. Uma simulação MD suficientemente longa e precisa poderia permitir que cientistas e designers de drogas visualizassem pela primeira vez muitos fenômenos bioquímicos criticamente importantes que não podem ser observados atualmente em experimentos de laboratório, incluindo o "dobramento" de proteínas em suas estruturas tridimensionais nativas, as mudanças estruturais que fundamentam a função da proteína e as interações entre duas proteínas ou entre uma proteína e uma molécula de droga candidata. Essas simulações podem responder a algumas das questões em aberto mais importantes nos campos da biologia e da química e têm o potencial de fazer contribuições substanciais para o processo de desenvolvimento de medicamentos.

Muitos dos processos biológicos mais importantes ocorrem em escalas de tempo da ordem de um milissegundo. As simulações de MD nesta escala de tempo, no entanto, estão várias ordens de magnitude além do alcance da tecnologia atual, apenas algumas execuções de MD até agora alcançaram até mesmo um microssegundo de tempo simulado, e a grande maioria foi limitada à escala de tempo de nanossegundos. Simulações em escala de milissegundos de um sistema biomolecular contendo dezenas de milhares de átomos irão, na prática, exigir que as forças exercidas por todos os átomos em todos os outros átomos sejam calculadas em apenas alguns microssegundos um processo que deve ser repetido na ordem de 10 12 vezes . Esses requisitos excedem em muito as capacidades atuais até mesmo dos mais poderosos clusters de commodities ou supercomputadores científicos de uso geral.

Este artigo descreve uma máquina especializada, massivamente paralela, chamada Anton, que foi projetada para acelerar simulações de DM em várias ordens de magnitude, trazendo simulações em escala de milissegundos ao alcance de sistemas moleculares envolvendo dezenas de milhares de átomos. A máquina, com conclusão prevista para o final de 2008, compreenderá 512 nós de processamento em sua configuração inicial, cada um contendo um mecanismo de computação MD especializado implementado como um único ASIC. O sistema molecular a ser simulado é decomposto espacialmente entre esses nós de processamento, que são conectados por meio de uma rede especializada de alto desempenho para formar um toro tridimensional. A vantagem de desempenho esperada de Anton deriva de uma combinação de hardware específico de MD que atinge um nível muito alto de densidade aritmética e novos algoritmos paralelos que aumentam a escalabilidade reduzindo a comunicação intra e inter-chip. A Figura 1 é uma fotografia de um dos primeiros ASICs Anton.

Ao projetar o Anton e seu software associado, tentamos atacar um problema um pouco diferente daquele abordado por vários outros projetos que implantaram recursos computacionais significativos para simulações de MD. O projeto Folding @ Home, 16 por exemplo, obteve uma série de resultados científicos significativos e interessantes usando até 250.000 PCs (disponibilizados na Internet por voluntários) para simular um grande número de trajetórias moleculares separadas, cada uma das quais está limitado à escala de tempo acessível em um único PC. Embora muito possa ser aprendido com um grande número de trajetórias independentes de DM, muitos outros problemas importantes requerem o exame de uma única e muito longa trajetória - a principal tarefa para a qual Anton foi projetado. Outros projetos, como FASTRUN, 6 MDGRAPE, 22 e MD Engine, 23 produziram hardware de propósito especial para acelerar os elementos mais caros computacionalmente de uma simulação MD. Esse hardware reduz o custo das simulações de MD, particularmente para grandes sistemas moleculares, mas a lei de Amdahl e os gargalos de comunicação impedem o uso eficiente de um número suficiente de tais chips em paralelo para estender as simulações individuais além das escalas de tempo de microssegundos.

Anton tem o nome de Anton van Leeuwenhoek, cujas contribuições para a ciência e a medicina esperamos imitar em nosso próprio trabalho. No século 17, van Leeuwenhoek, muitas vezes referido como o "pai da microscopia", construiu instrumentos ópticos de alta precisão que lhe permitiram visualizar pela primeira vez um mundo biológico inteiramente novo que antes era desconhecido pelos cientistas de sua época. Vemos Anton (a máquina) como uma espécie de "microscópio computacional". Na medida em que nós e outros pesquisadores somos capazes de aumentar a duração das simulações de DM, esperamos fornecer aos pesquisadores biológicos e biomédicos contemporâneos uma ferramenta para compreender organismos e suas doenças em uma escala de comprimento ainda menor.

2. Computação MD em Anton

Um cálculo MD simula o movimento de uma coleção de átomos (o sistema químico) durante um período de tempo de acordo com as leis da física clássica. 1 O tempo é dividido em uma série de discretas passos de tempo, cada um representando alguns femtossegundos de tempo simulado. Uma etapa de tempo tem duas fases principais. Cálculo de força calcula a força em cada partícula devido a outras partículas no sistema. Integração usa a força resultante em cada partícula para atualizar a posição e a velocidade dessa partícula.

As forças interatômicas são calculadas com base em um campo de força da mecânica molecular (ou simplesmente campo de força), que modela as forças em cada átomo como uma função das coordenadas espaciais de todos os átomos. Nos campos de força biomoleculares comumente usados, 9,11,15 as forças consistem em três componentes: forças de ligação, envolvendo grupos de átomos separados por não mais do que três ligações covalentes forças van der Waals, calculado entre pares de átomos separados por menos do que algum raio de corte (geralmente escolhido entre 5 e 15 e Aring) e forças eletrostáticas, que são os mais intensivos do ponto de vista computacional, pois devem ser calculados entre todos os pares de átomos.

Anton usa o k-space Gaussian split método de Ewald (k-GSE) 18 para reduzir a carga de trabalho computacional associada às interações eletrostáticas. Este método divide o cálculo da força eletrostática em dois componentes. O primeiro decai rapidamente com a separação de partículas e é calculado diretamente para todos os pares de partículas separados por menos de um raio de corte. Referimo-nos a esta contribuição, juntamente com as interações de van der Waals, como interações com alcance limitado. O segundo componente, interações de longo alcance, decai mais lentamente, mas pode ser calculado de forma eficiente mapeando a carga das partículas para uma malha regular (espalhamento de carga), tomando a transformada rápida de Fourier (FFT) das cargas de malha, multiplicando por uma função apropriada no espaço de Fourier, realizando uma FFT inversa e, em seguida, calculando as forças nas partículas a partir dos valores de malha resultantes (interpolação de força).

Para paralelizar interações com alcance limitado, nossa máquina usa um algoritmo que desenvolvemos chamado de Método NT. 19 O método NT atinge reduções assintóticas e práticas na largura de banda de comunicação entre processadores necessária em relação aos métodos tradicionais de paralelização. É um de vários métodos de território neutro que empregam uma atribuição espacial de partículas a nós, mas que geralmente calculam a interação entre duas partículas usando um nó no qual nenhuma das partículas reside. 4,7,10,14,17,21

A fase de integração usa os resultados do cálculo da força para atualizar as posições e velocidades atômicas, integrando numericamente um conjunto de equações diferenciais ordinárias que descrevem o movimento dos átomos. Os integradores numéricos usados ​​no MD não são triviais por vários motivos. Primeiro, o algoritmo de integração e a maneira como os problemas numéricos são tratados podem ter um efeito significativo na precisão. Em segundo lugar, algumas simulações requerem que o integrador calcule e ajuste propriedades globais, como temperatura e pressão. Finalmente, pode-se acelerar significativamente a maioria das simulações incorporando restrições que eliminam os movimentos vibracionais mais rápidos. Por exemplo, as restrições são normalmente usadas para fixar os comprimentos das ligações a todos os átomos de hidrogênio e para manter as moléculas de água rígidas.

3. Por que Hardware Especializado?

Uma questão natural é se uma máquina especializada para simulação molecular pode obter uma vantagem significativa de desempenho sobre o hardware de uso geral. Afinal, a história está repleta de cadáveres de máquinas especializadas, abrangendo uma vasta gama de máquinas Lisp a aceleradores de banco de dados. Ganhos de desempenho e contagem de transistores previstos pela lei de Moore, juntamente com as economias de escala por trás do desenvolvimento de processadores de commodities, conduziram uma história de microprocessadores de uso geral ultrapassando as soluções de uso especial. Qualquer plano para construir hardware especializado deve levar em conta o crescimento exponencial esperado nas capacidades de hardware de uso geral.

Concluímos que o hardware para fins especiais é garantido neste caso porque leva a uma melhoria muito maior no desempenho absoluto do que a aceleração esperada prevista pela lei de Moore ao longo do nosso período de desenvolvimento, e porque estamos atualmente no limite de simular escalas de tempo de grande significado biológico. Esperamos que Anton execute simulações 1000 vezes mais rápido do que era possível quando iniciamos este projeto. Supondo que as densidades do transistor continuem a dobrar a cada 18 meses e que esses aumentos se traduzam em processadores e links de comunicação proporcionalmente mais rápidos, seria de se esperar uma melhoria de aproximadamente dez vezes nas soluções de commodities ao longo do tempo de desenvolvimento de cinco anos de nossa máquina (da conceituação ao desenvolvimento ) Portanto, esperamos que uma solução especializada seja capaz de acessar escalas de tempo biologicamente críticas de milissegundos significativamente mais cedo do que o hardware comum.

Para simular um milissegundo dentro de alguns meses, devemos completar uma etapa de tempo a cada poucos microssegundos ou a cada alguns milhares de tiques do relógio. A dependência sequencial de etapas sucessivas de tempo em uma simulação MD torna a especulação através de etapas de tempo extremamente difícil. Felizmente, a especialização oferece oportunidades únicas para acelerar um intervalo de tempo individual usando uma combinação de recursos arquitetônicos que reduzem a latência computacional e a latência de comunicação.

Por exemplo, reduzimos a latência computacional projetando:

  • Caminhos de dados de hardware especializados e dedicados e lógica de controle para avaliar as interações de alcance limitado e para realizar o espalhamento de carga e a interpolação de força. Além de incluir muito mais lógica computacional em um chip do que o típico de arquiteturas de uso geral, esses pipelines usam precisão personalizada para cada operação.
  • Processadores especializados, embora programáveis, para calcular as forças de ligação e o FFT e para realizar a integração. A arquitetura do conjunto de instruções (ISA) desses processadores é adaptada aos cálculos que eles realizam. Sua programabilidade fornece flexibilidade para acomodar vários campos de força e algoritmos de integração.
  • Suporte dedicado no subsistema de memória para acumular forças para cada partícula.

Reduzimos a latência de comunicação projetando:

  • Uma rede de baixa latência e alta largura de banda, tanto dentro de um ASIC quanto entre ASICs, que inclui suporte de roteamento especializado para padrões de comunicação MD comuns, como multicast e transferências compactadas de estruturas de dados esparsas.
  • Suporte para comunicação baseada em & quotpush & quot coreografada. Os produtores enviam os resultados aos consumidores sem que eles tenham que solicitar os dados com antecedência.
  • Um conjunto de mecanismos de acesso direto autônomo à memória (DMA) que descarregam tarefas de comunicação das unidades computacionais, permitindo maior sobreposição de comunicação e computação.
  • Recursos de controle de admissão que priorizam pacotes que transportam certos tipos de dados específicos de algoritmo.

Equilibramos nosso projeto de maneira muito diferente de uma arquitetura de supercomputador de uso geral. Em relação a outros aplicativos de computação de alto desempenho, o MD usa muita comunicação e computação, mas surpreendentemente pouca memória. Todo o estado arquitetônico de uma simulação de MD de 25.000 partículas, por exemplo, é de apenas 1,6 MB ou 3,2 KB por nó em um sistema de 512 nós. Exploramos essa propriedade usando apenas SRAMs e pequenos caches L1 em ​​nosso ASIC, com todo o código e ajuste de dados no chip em operação normal. Em vez de gastar área de silício em grandes caches e hierarquias de memória agressivas, nós a dedicamos à comunicação e computação.

É um acaso que as partes mais computacionalmente intensivas do MD em particular, as interações eletrostáticas são também as mais bem estabelecidas e improváveis ​​de mudar à medida que os modelos de campo de força evoluem, tornando-os particularmente suscetíveis à aceleração de hardware. Acelerar drasticamente a simulação de MD, no entanto, requer que aceleremos mais do que apenas um "loop interno".

O cálculo das forças eletrostáticas e de van der Waals é responsável por cerca de 90% do tempo computacional para uma simulação representativa de MD em um único processador de uso geral. A lei de Amdahl afirma que não importa o quanto aceleremos este cálculo, os cálculos restantes, deixados sem aceleração, limitariam nossa velocidade máxima a um fator de 10. Portanto, dedicamos uma fração significativa da área de silício para acelerar outras tarefas, como a força de ligação computação, computação de restrição e atualizações de velocidade e posição, incorporando a programabilidade conforme apropriado para acomodar uma variedade de campos de força e métodos de integração.

4. Arquitetura do sistema

O bloco de construção do sistema é um nó, representado na Figura 2. Cada nó compreende um ASIC específico de MD, DRAM conectado e seis portas para a rede de interconexão de todo o sistema. Cada ASIC tem quatro subsistemas principais, que são descritos resumidamente nesta seção. Os nós, que são logicamente idênticos, são conectados em uma topologia de toro tridimensional (que mapeia naturalmente para as condições de contorno periódicas freqüentemente usadas em simulações de MD). A versão inicial do Anton será um toro de 512 nós com oito nós em cada dimensão, mas nossa arquitetura também suporta configurações toroidais maiores e menores. Os ASICs têm um clock modesto de 400 MHz, com exceção de um componente de clock duplo no subsistema de interação de alto rendimento (HTIS), discutido na seção seguinte.

4.1. Subsistema de interação de alto rendimento

O HTIS calcula as interações de alcance limitado e executa a dispersão de carga e a interpolação de força. O HTIS, cuja estrutura interna é mostrada na Figura 3, aplica um paralelismo maciço a essas operações, que constituem a maior parte do cálculo em MD. Ele fornece um rendimento aritmético tremendo usando uma matriz de 32Módulos de interação pairwisepoint (PPIMs) (Figura 3), cada um dos quais inclui um pipeline de cálculo de força que funciona a 800 MHz e é capaz de calcular as interações eletrostáticas e van der Waals combinadas entre um par de átomos em cada ciclo. Este pipeline de 26 estágios (Figura 4) inclui somadores, multiplicadores, unidades de avaliação de função e outros elementos de caminho de dados especializados. Dentro desse pipeline, usamos precisões numéricas personalizadas: a largura da unidade funcional varia entre os diferentes estágios do pipeline, mas ainda produz um resultado de 32 bits suficientemente preciso.

Para manter os pipelines ocupados com computação útil, o restante do HTIS deve determinar pares de átomos que precisam interagir, alimentá-los para os pipelines e agregar as saídas dos pipelines.Isso prova um desafio formidável dadas as limitações de largura de banda de comunicação entre ASICs, entre o HTIS e outros subsistemas no mesmo ASIC e entre pipelines dentro do HTIS. Abordamos este problema usando uma arquitetura adaptada para operações de redução de seleção direta de produto (DPSRs), que pegam dois conjuntos de pontos e executam cálculos proporcionais ao produto dos tamanhos definidos, mas requerem apenas volume de entrada e saída proporcional à soma de seus tamanhos. O HTIS considera as interações entre todos os átomos em uma região chamada de torre e todos os átomos em uma região chamada de placa. Cada átomo na torre é atribuído a um PPIM, enquanto cada átomo na placa flui por todos os PPIMs. Oito combinar unidades em cada PPIM execute vários testes, incluindo uma verificação de distância de baixa precisão, para determinar quais pares de placas e partículas de torre são alimentados para o pipeline de cálculo de força. Como o HTIS é uma arquitetura de streaming, sem feedback em seu caminho computacional, é simples dimensionar o array PPIM para qualquer número de PPIMs. O HTIS também inclui um bloco de controle de interação processador, que controla o fluxo de dados por meio do HTIS. Mais detalhes sobre o HTIS e sobre as operações DPSR podem ser encontrados nos anais da conferência HPCA deste ano. 13

Os PPIMs são o componente mais conectado de nossa arquitetura, refletindo o fato de que eles lidam com as partes mais intensivas do cálculo do MD. Dito isso, mesmo os PPIMs incluem programabilidade em que antecipamos possíveis alterações futuras para campos de força. Por exemplo, as formas funcionais para van der Waals e interações eletrostáticas são especificadas usando tabelas de consulta SRAM, cujos conteúdos são determinados em tempo de execução.

4.2. Subsistema Flexível

o subsistema flexível controla o ASIC e lida com todos os outros cálculos, incluindo os cálculos de força de união, o FFT e integração. A Figura 5 mostra os componentes do subsistema flexível. Quatro idênticos fatias de processamento formam o núcleo do subsistema flexível. Cada fatia compreende um núcleo de uso geral com seus caches, um unidade de acesso remoto (RAU) que realiza transferências de dados autônomas, e dois núcleos geométricos (GCs), que são núcleos programáveis ​​que realizam a maior parte da computação do subsistema flexível. O RAU é um mecanismo de transferência de dados programável que permite que o subsistema flexível participe da comunicação & quotpush & quot, descarregando mensagens enviadas dos núcleos do processador e rastreando mensagens de entrada para determinar quando o trabalho está pronto para ser feito. Cada GC é um processador SIMD de 4 vias, de edição dupla, estaticamente programado, com suporte múltiplo acumulado em pipeline e extensões de conjunto de instruções para oferecer suporte a cálculos MD comuns. Outros componentes do subsistema flexível incluem um pipeline de correção, que calcula os termos de correção de força, uma pista de corrida, que serve como uma interconexão interna local para os componentes do subsistema flexível e uma unidade de interface em anel, que permite que os componentes do subsistema flexível transfiram pacotes de e para o subsistema de comunicação. Mais detalhes sobre o subsistema flexível são fornecidos em um segundo artigo na conferência HPCA deste ano. 12

4.3. Subsistema de Comunicação

o subsistema de comunicação fornece comunicação de alta velocidade e baixa latência entre ASICs e entre os subsistemas de um ASIC. Entre os chips, cada link toróide fornece comunicação full-duplex de 5,3 GB / s com uma latência de salto em torno de 50 ns. Dentro de um chip, dois anéis de comunicação de 256 bits e 400 MHz ligam todos os subsistemas e as seis portas toroidais entre chips. O subsistema de comunicação suporta multicast eficiente, fornece controle de fluxo e fornece controle de admissão baseado em classe com medição de taxa. O subsistema de comunicação também permite o acesso a um sistema de computador host externo para entrada e saída de dados de simulação.

o subsistema de memória fornece acesso à DRAM anexada do ASIC. Além do acesso básico de leitura / gravação à memória, o subsistema de memória suporta acumulação e sincronização. As operações especiais de gravação na memória adicionam numericamente os dados de gravação recebidos ao conteúdo do local da memória especificado na operação. Essas operações implementam acumulações de força, energia, potencial e propagação de carga, reduzindo a carga de computação e comunicação no subsistema flexível. Tirando vantagem da DRAM anexada, Anton será capaz de simular sistemas químicos com bilhões de átomos.

5. Medições de desempenho e precisão

Nesta seção, mostramos que o desempenho do Anton excede significativamente o de outras plataformas MD e que o Anton é capaz de realizar simulações de alta precisão numérica. Como ainda não temos um segmento de 512 nós em funcionamento, as estimativas de desempenho para nossa máquina vêm de nosso simulador de desempenho. A fidelidade do ciclo deste simulador varia entre os componentes, mas esperamos uma fidelidade geral melhor do que & plusmn20%.

5.1. Comparação de Desempenho

Comparamos o desempenho de várias plataformas de MD em termos de taxa de simulação (nanossegundos de tempo simulado por dia de execução) em um sistema químico específico. Nesta seção e na Seção 5.2, usamos um sistema com 23.558 átomos em uma caixa cúbica medindo 62,2 & Aring em um lado. Este sistema representa a dihidrofolato redutase (DHFR), uma proteína direcionada por vários medicamentos contra o câncer, rodeada por água.

Os códigos MD de mais alto desempenho alcançam uma taxa de simulação de alguns nanossegundos por dia para DHFR em um único núcleo de processador de commodity de última geração. 8 As máquinas multiprocessadoras existentes com interconexões de alto desempenho alcançam taxas de simulação de até algumas centenas de nanossegundos por dia, usando muitas centenas ou milhares de núcleos de processador. 2,3,5

Esperamos que um sistema Anton de 512 nós atinja uma taxa de simulação de aproximadamente 14.500 nanossegundos por dia para DHFR, permitindo uma simulação de milissegundos em pouco mais de dois meses. Embora o desempenho das máquinas de uso geral, sem dúvida, continue a melhorar, a vantagem de desempenho do Anton sobre outras plataformas MD excede significativamente a aceleração prevista pela lei de Moore nos próximos anos. Uma comparação de desempenho mais detalhada de Anton e outras plataformas MD é fornecida nos anais da conferência ISCA do ano passado. 20

Para quantificar a precisão do cálculo da força em Anton, medimos o erro relativo de força rms, definido como o erro rms na força em todas as partículas dividido pela força rms. 18 Para o sistema DHFR com parâmetros de simulação típicos, Anton atinge um erro de força rms relativo de 1,5 e vezes 10 -4. Um erro de força rms relativo abaixo de 10 -3 é geralmente considerado suficientemente preciso para simulações biomoleculares de MD. 25

Nós também medimos deriva de energia para quantificar a precisão geral de nossas simulações. Uma simulação MD exata conservaria energia exatamente. Erros na simulação geralmente levam a um aumento na energia total do sistema simulado com o tempo, um fenômeno conhecido como deriva de energia. Medimos a deriva de energia em 5 ns de tempo simulado (2 milhões de etapas de tempo) para DHFR usando um emulador numérico de precisão de bits que duplica exatamente a aritmética de Anton. Enquanto a simulação exibiu flutuações de energia de curto prazo de algumas kcal / mol (cerca de 0,001% da energia total do sistema), não houve tendência de longo prazo detectável na energia total. Os estudos de DM são geralmente considerados mais do que adequados, mesmo com um desvio de energia significativamente maior. 24

5.3. Escala com o tamanho do sistema químico

A Figura 6 mostra a escala de desempenho com o tamanho do sistema químico. Dentro da faixa em que os sistemas químicos se encaixam na memória on-chip, esperamos que o desempenho seja escalonado aproximadamente linearmente com o número de átomos, embora com saltos ocasionais conforme os parâmetros operacionais diferentes mudam para otimizar o desempenho, mantendo a precisão. A maior descontinuidade na taxa de simulação ocorre em um volume de sistema de aproximadamente 500.000 & Aring 3 quando mudamos de uma grade 32 & times 32 & times 32 FFT para uma grade 64 & times 64 & times 64 FFT, refletindo o fato de que nosso código suporta apenas power-of- FFTs de dois comprimentos. Isso alonga o cálculo de longo alcance porque o número de pontos de grade aumenta em um fator de 8. No geral, os resultados são consistentes com estudos de aumento de escala do supercomputador conforme aumentamos o tamanho do sistema químico, a eficiência de Anton melhora devido à melhor sobreposição de comunicação e computação, e porque pipelines de cálculo operam mais perto da eficiência máxima.

6. Conclusão

No momento, estamos no processo de construção de uma máquina especializada massivamente paralela, chamada Anton, para a execução em alta velocidade de simulações de MD. Esperamos que Anton seja capaz de simular o comportamento dinâmico em nível atômico de proteínas e outras macromoléculas biológicas em um ambiente de solvente explicitamente representado por períodos da ordem de um milissegundo cerca de três ordens de magnitude além do alcance das simulações atuais de MD. A máquina usa ASICs especializados, cada um dos quais executa um grande número de cálculos específicos de aplicativos durante cada ciclo de clock. Novas técnicas arquitetônicas e algorítmicas são usadas para minimizar a comunicação intra e entre chips, fornecendo um grau excepcionalmente alto de escalabilidade.

Embora contenha elementos programáveis ​​que poderiam, em princípio, suportar a execução paralela de algoritmos para uma ampla gama de outras aplicações, Anton não foi projetado para funcionar como um supercomputador científico de propósito geral e, na prática, não seria adequado para tal função. Em vez disso, imaginamos Anton servindo como um microscópio computacional, permitindo aos pesquisadores observar pela primeira vez uma ampla gama de estruturas e processos biologicamente importantes que até agora se mostraram inacessíveis para modelagem computacional e experimentos de laboratório.

Referências

1. Adcock, S.A. e McCammon, J.A. Dinâmica molecular: Levantamento de métodos para simular a atividade de proteínas. Revisão Química, 106:15891615, 2006.

2. Bhatele, A., Kumar, S., Mei, C., Phillips, J.C., Zheng, G., e Kale, L.V. Superando desafios de dimensionamento em simulações biomoleculares em várias plataformas, para aparecer em Proceedings of the IEEE International Parallel and Distributed Processing Symposium (IPDPS 2008), Miami, FL, 2008.

3. Bowers, KJ, Chow, E., Xu, H., Dror, RO, Eastwood, MP, Gregersen, BA, Klepeis, JL, Kolossvary, I., Moraes, MA, Sacerdoti, FD, Salmon, JK, Shan , Y., e Shaw, DE Algoritmos escaláveis ​​para simulações de dinâmica molecular em aglomerados de commodities. Proceedings of the ACM // IEEE Conference on Supercomputing (SC06). Tampa, FL, 2006.

4. Bowers, K.J., Dror, R.O. e Shaw, D.E. Métodos zonais para a execução paralela de problemas de N-corpos com limites de alcance. Journal of Computational Physics, 221(1):303329, 2007.

5. Fitch, B.G., Rayshubskiy, A., Eleftheriou, M., Ward, T.J.C., Giampapa, M.E., Pitman, M.C., Pitera, J.W., Swope, W.C., e Germain, R.S. Matéria azul: escala de simulações de N-body para um átomo por nó. IBM Journal of Research and Development, 52(1/2), 2008.

6. Fine, R.D., Dimmler, G., e Levinthal, C. FASTRUN: A propósito especial, computador com fio para simulação molecular. Proteínas: Estrutura, Função e Genética, 11 (4): 242253, 1991 (errata: 14 (3): 421422, 1992).

7. Germain, R.S., Fitch, B., Rayshubskiy, A., Eleftheriou, M., Pitman, M.C., Suits, F., Giampapa, M., e Ward, T.J.C. Matéria azul no gene azul / L: computação maciçamente paralela para simulação biomolecular. Proceedings of the Third IEEE / ACM / IFIP International Conference on Hardware / Software Codesign and System Synthesis (CODES + ISSS '05), Nova York, NY, 2005.

8. Hess, B., Kutzner, C., van der Spoel, D., e Lindahl, E. GROMACS 4: Algorithms for altamente eficiente, carga balanceada e simulação molecular escalável. Jornal de Teoria Química e Computação, 4(2):435447, 2008.

9. Jorgensen, W.L., Maxwell, D.S., e Tirado-Rives, J. Desenvolvimento e teste do campo de força de todos os átomos OPLS em energia conformacional e propriedades de líquidos orgânicos. Journal of the American Chemical Society, 118(45):1122511236, 1996.

10. Kal & eacute, L., Skeel, R., Bhandarkar, M., Brunner, R., Gursoy, A., Krawetz, N., Phillips, J., Shinozaki, A., Varadarajan, K., and Schulten, K., NAMD2: Maior escalabilidade para dinâmica molecular paralela. Journal of Computational Physics, 151(1):283312, 1999.

11. Kollman, PA, Dixon, RW, Cornell, WD, Fox, T., Chipot, C., e Pohorille, A. O desenvolvimento / aplicação de um campo de força mecânico orgânico / biomolecular "Minimalista" usando uma combinação de cálculos ab initio e experimental dados, em Simulação Computacional de Sistemas Biomoleculares: Aplicações Teóricas e Experimentais, van Gunsteren, W.F. e Weiner, P.K. eds., Dordrecht, Netherlands: ESCOM, pp. 8396, 1997.

12. Kuskin, J.S., Young, C., Grossman, J.P., Batson, B., Deneroff, M.M., Dror, R.O., e Shaw, D.E. Incorporando flexibilidade no Anton, uma máquina especializada para simulação de dinâmica molecular. Proceedings of the 14th International Symposium on HighPerformance Computer Architecture (HPCA-14), Salt Lake City, UT, 2008.

13. Larson, R.H., Salmon, J.K., Dror, R.O., Deneroff, M.M., Young. C., Grossman, J.P., Shan, Y., Klepeis, J.L., e Shaw, D.E. Interações de ponto em pares de alto rendimento em Anton, uma máquina especializada para simulação de dinâmica molecular. Anais do 14º Simpósio Internacional de Arquitetura de Computadores de Alto Desempenho (HPCA-14), Salt Lake City, UT, 2008.

14. Liem, S.Y., Brown, D. e Clarke, J.H.R. Simulações de dinâmica molecular em máquinas de memória distribuída. Comunicações de Física da Computação, 67(2):261267, 1991.

15. MacKerell, AD Jr., Bashford, D., Bellott, M., Dunbrack, RL, Evanseck, JD, Field, MJ, Fischer, S., Gao, J., Guo, H., Ha, S., Joseph-McCarthy, D., Kuchnir, L., Kuczera, K., Lau, FTK, Mattos, C., Michnick, S., Ngo, T., Nguyen, DT, Prodhom, B., Reiher, III, WE , Roux, B., Schlenkrich, M., Smith, JC, Stote, R., Straub, J., Watanabe, M., Wi & oacuterkiewicz-Kuczera, J., Yin, D., e Karplus, MJ All-atom empírico potencial para modelagem molecular e estudos de dinâmica de proteínas. Journal of Physical Chemistry B, 102 (18): 35863616, 1998.

16. Pande, VS, Baker, I., Chapman, J., Elmer, SP, Khaliq, S., Larson, SM, Rhee, YM, Shirts, MR, Snow, CD, Sorin, EJ e Zagrovic, B. Simulações de dobramento de proteínas atomísticas na escala de tempo de submilissegundos usando computação distribuída em todo o mundo. Biopolímeros, 68(1):91109, 2003.

17. Plimpton, S.J., Attaway, S., Hendrickson, B., Swegle, J., Vaughan, C., e Gardner, D. Simulações de dinâmica transiente: Algoritmos paralelos para detecção de contato e hidrodinâmica de partículas suavizadas. Proceedings of the ACM // IEEE Conference on Supercomputing (Supercomputing '96), Pittsburgh, PA, 1996.

18. Shan, Y., Klepeis, J.L., Eastwood, M.P., Dror, R.O., e Shaw, D.E. Gaussian split Ewald: Um método de malha de Ewald rápido para simulação molecular. Journal of Chemical Physics, 122:054101, 2005.

19. Shaw, D.E. Um método rápido e escalável para a avaliação paralela de interações de partículas em pares com distância limitada. Journal of Computational Chemistry, 26(13):13181328, 2005.

20. Shaw, DE, Deneroff, MM, Dror, RO, Kuskin, JS, Larson, RH, Salmon, JK, Young, C., Batson, B., Bowers, KJ, Chao, JC, Eastwood, MP, Gagliardo, J., Grossman, JP, Ho, CR, lerardi, DJ, Kolossv & aacutery, I., Klepeis, JL, Layman, T., McLeavey, C., Moraes, MA, Mueller, R., Priest, EC, Shan, Y ., Spengler, J., Theobald, M., Towles, B., e Wang, SC, Anton, uma máquina de propósito especial para simulação de dinâmica molecular. Anais do 34º Simpósio Internacional Anual de Arquitetura de Computadores (ISCA '07), San Diego, CA, 2007.

21. Snir, M. A Note on N-body computations with cutoffs. Teoria de Sistemas Computacionais, 37:295318, 2004.

22. Taiji, M., Narumi, T., Ohno, Y., Futatsugi, N., Suenaga, A., Takada, N., e Konagaya, A., Protein explorer: A petaflops sistema de computador de propósito especial para molecular simulações de dinâmica. Proceedings of the ACM / IEEE Conference on Supercomputing (SC03), Phoenix, AZ, 2003.

23. Toyoda, S., Miyagawa, H., Kitamura, K., Amisaki, T., Hashimoto, E., Ikeda, H., Kusumi, A., e Miyakawa, N. Desenvolvimento do motor MD: alta velocidade acelerador com design de processador paralelo para simulações de dinâmica molecular. Journal Computational Chemistry, 20(2): 185199, 1999.


3. Mecânica Estatística

Simulações de dinâmica molecular geram informações em nível microscópico, incluindo posições e velocidades atômicas. A conversão dessas informações microscópicas em observáveis ​​macroscópicos, como pressão, energia, capacidades de calor, etc., requer mecânica estatística. A mecânica estatística é fundamental para o estudo de sistemas biológicos por simulação de dinâmica molecular. Nesta seção, fornecemos uma breve visão geral de alguns tópicos principais. Para obter informações mais detalhadas, consulte os inúmeros livros excelentes disponíveis sobre o assunto.

Introdução à Mecânica Estatística:

Em uma simulação de dinâmica molecular, muitas vezes deseja-se explorar as propriedades macroscópicas de um sistema por meio de simulações microscópicas, por exemplo, para calcular mudanças na energia livre de ligação de um candidato a medicamento específico ou para examinar a energética e os mecanismos de mudança conformacional. A conexão entre simulações microscópicas e propriedades macroscópicas é feita via mecânica estatística que fornece as expressões matemáticas rigorosas que relacionam as propriedades macroscópicas à distribuição e ao movimento dos átomos e moléculas das simulações de dinâmica molecular do sistema de N-corpos fornecem os meios para resolver a equação de movimento das partículas e avaliar essas fórmulas matemáticas. Com simulações de dinâmica molecular, pode-se estudar propriedades termodinâmicas e / ou fenômenos dependentes do tempo (cinéticos).

D. McQuarrie, Statistical Mechanics (Harper & amp Row, Nova York, 1976)

D. Chandler, Introdução à Mecânica Estatística Moderna (Oxford University Press, Nova York, 1987)

A mecânica estatística é o ramo das ciências físicas que estuda sistemas macroscópicos do ponto de vista molecular. O objetivo é compreender e prever fenômenos macroscópicos a partir das propriedades das moléculas individuais que constituem o sistema. O sistema pode variar de uma coleção de moléculas de solvente a um complexo solvatado de proteína-DNA. Para conectar o sistema macroscópico ao sistema microscópico, as médias estatísticas independentes do tempo são frequentemente introduzidas. Começamos esta discussão introduzindo algumas definições.

o estado termodinâmico de um sistema é geralmente definido por um pequeno conjunto de parâmetros, por exemplo, a temperatura, T, a pressão, P e o número de partículas, N. Outras propriedades termodinâmicas podem ser derivadas das equações de estado e outras equações termodinâmicas fundamentais .

o mecânico ou estado microscópico de um sistema é definido pelas posições atômicas, qe momento, p estes também podem ser considerados como coordenadas em um espaço multidimensional chamado espaço de fase. Para um sistema de N partículas, este espaço tem 6N dimensões. Um único ponto no espaço de fase, denotado por G , descreve o estado do sistema. Um conjunto é uma coleção de pontos no espaço de fase que satisfaz as condições de um estado termodinâmico particular. Uma simulação de dinâmica molecular gera uma sequência de pontos no espaço de fase em função do tempo esses pontos pertencem ao mesmo conjunto, e correspondem às diferentes conformações do sistema e seus respectivos momentos. Vários conjuntos diferentes são descritos abaixo.

Um conjunto é uma coleção de todos os sistemas possíveis que têm diferentes estados microscópicos, mas têm um estado macroscópico ou termodinâmico idêntico.

Existem diferentes conjuntos com diferentes características.

  • Conjunto microcanônico (NVE): o estado termodinâmico caracterizado por um número fixo de átomos, N, um volume fixo, V, e uma energia fixa, E. Isso corresponde a um sistema isolado.
  • Conjunto canônico (NVT): é uma coleção de todos os sistemas cujo estado termodinâmico é caracterizado por um número fixo de átomos, N, um volume fixo, V, e uma temperatura fixa, T.
  • Conjunto Isobárico-Isotérmico (NPT): Este conjunto é caracterizado por um número fixo de átomos, N, uma pressão fixa, P, e uma temperatura fixa, T.
  • Grande conjunto canônico (m VT): O estado termodinâmico para este conjunto é caracterizado por um potencial químico fixo, m, um volume fixo, V, e uma temperatura fixa, T.

Calculando Médias de uma Simulação de Dinâmica Molecular

Um experimento é geralmente feito em uma amostra macroscópica que contém um número extremamente grande de átomos ou moléculas amostrando um número enorme de conformações. Na mecânica estatística, as médias correspondentes aos observáveis ​​experimentais são definidas em termos de médias do conjunto. Uma justificativa para isso é que houve uma boa concordância com o experimento. Uma média de conjunto é a média obtida sobre um grande número de réplicas do sistema consideradas simultaneamente.

Na mecânica estatística, os valores médios são definidos como médias do conjunto.

A média do conjunto é dada por

é o observável de interesse e é expresso como uma função dos momentos, p, e as posições, r, do sistema. A integração envolve todas as variáveis ​​possíveis de r e p.

A densidade de probabilidade do conjunto é dada por

Onde H é o hamiltoniano, T é a temperatura, kB é Boltzmann & # 146s constante e Q é a função de partição

Esta integral é geralmente extremamente difícil de calcular porque é preciso calcular todos os estados possíveis do sistema. Em uma simulação de dinâmica molecular, os pontos no conjunto são calculados sequencialmente no tempo, portanto, para calcular uma média do conjunto, as simulações de dinâmica molecular devem passar por todos os estados possíveis correspondentes às restrições termodinâmicas particulares.

Outra maneira, como feito em uma simulação MD, é determinar uma média de tempo de A, que é expressa como

onde t é o tempo de simulação, M é o número de etapas de tempo na simulação e A (pN, rN) é o valor instantâneo de UMA.

O dilema parece ser que se pode calcular médias de tempo por simulação de dinâmica molecular, mas os observáveis ​​experimentais são considerados médias de conjuntos. Resolver isso nos leva a um dos axiomas mais fundamentais da mecânica estatística, o hipótese ergódica, que afirma que a média do tempo é igual à média do conjunto.

A ideia básica é que, se permitirmos que o sistema evolua indefinidamente no tempo, esse sistema acabará por passar por todos os estados possíveis. Um objetivo, portanto, de uma simulação de dinâmica molecular é gerar conformações representativas suficientes para que essa igualdade seja satisfeita. Se este for o caso, informações experimentalmente relevantes sobre propriedades estruturais, dinâmicas e termodinâmicas podem então ser calculadas usando uma quantidade viável de recursos de computador. Como as simulações têm duração fixa, deve-se ter certeza de amostrar uma quantidade suficiente de espaço de fase.

Alguns exemplos de médias de tempo:

Energia potencial média

Onde M é o número de configurações na trajetória da dinâmica molecular e Vi é a energia potencial de cada configuração.

Energia cinética média

Onde M é o número de configurações na simulação, N é o número de átomos no sistema, mi é a massa da partícula eu e vi é a velocidade da partícula eu.

Uma simulação de dinâmica molecular deve ser suficientemente longa para que conformações representativas suficientes tenham sido amostradas.


Por que adicionar hidrogênios em simulações de dinâmica molecular? - Biologia

Muito da ciência pode ser explicado pelo movimento e interação das moléculas. A dinâmica molecular (DM) é uma técnica computacional utilizada para explorar esses fenômenos, desde gases nobres até macromoléculas biológicas. Molly.jl é um pacote Julia puro para MD e para a simulação de sistemas físicos de forma mais ampla.

No momento, o pacote é uma prova de conceito para MD em Julia. Não está pronto para produção. Ele pode simular um sistema de átomos com interações arbitrárias conforme definido pelo usuário. Os recursos implementados incluem:

  • Interface para permitir a definição de novas forças, simuladores, termostatos, localizadores de vizinhos, madeireiros etc.
  • Leia a topologia Gromacs pré-computada e coordene os arquivos com o campo de força OPLS-AA e execute o MD em proteínas com os parâmetros fornecidos. Em teoria, ele pode fazer isso com qualquer proteína regular, mas na prática isso não foi testado.
  • Interações não ligadas - Lennard-Jones Van der Waals / força de repulsão, potencial de Coulomb eletrostático, potencial gravitacional, potencial de esfera mole, potencial de Mie.
  • Interações ligadas - ligações covalentes, ângulos de ligação, ângulos de torção.
  • Termostato Andersen.
  • Velocity Verlet e integração Verlet sem velocidade.
  • Solvente explícito.
  • Condições de contorno periódicas em uma caixa cúbica.
  • Lista de vizinhos para agilizar o cálculo das forças não unidas.
  • Multithreading automático.
  • Aceleração de GPU em dispositivos habilitados para CUDA.
  • Execute com Float64 ou Float32.
  • Algumas funções de análise, por exemplo RDF.
  • Modelagem baseada em agente físico.
  • Visualize simulações como animações.
  • Simulação molecular diferenciável em um ramo experimental - consulte os documentos relevantes.

Os recursos ainda não implementados incluem:

  • Campos de força de proteínas diferentes de OPLS-AA.
  • Modelos de água.
  • Minimização de energia.
  • Outros métodos de acoplamento de temperatura ou pressão.
  • Lista de vizinhos baseada em células.
  • Preparação de proteína - caixa de solvente, adicionar hidrogênios etc.
  • Leitores / gravadores de formato de arquivo de trajetória / topologia.
  • Modelagem mecânica quântica.
  • Alta cobertura de teste.

Julia é necessária, com Julia v1.6 ou posterior necessária para obter a versão mais recente do Molly. Instale Molly do Julia REPL. Entre no modo de pacote pressionando] e execute add Molly.

Alguns exemplos são dados aqui, consulte a documentação para obter mais informações sobre como usar o pacote.

Simulação de um gás Lennard-Jones:

A simulação de 1 ps acima se parece com isto quando você a visualiza no VMD:


Simulações de Dinâmica Molecular do Canal da Gramicidina

Muitos sistemas de repetições palindrômicas curtas regularmente interespaçadas (CRISPR) - associadas a CRISPR (Cas) de bactérias agrupadas empregam a endonuclease de DNA guiada por RNA dupla Cas9 para se defender contra fagos invasores e plasmídeos conjugativos pela introdução de locais específicos. consulte Mais informação

Materiais Suplementares

Vídeos Suplementares 1 e 2 Leia Mais

Figura 1: Interferência de DNA mediada por CRISPR-Cas9 na imunidade adaptativa bacteriana. (a) Um locus CRISPR típico em um sistema CRISPR-Cas tipo II compreende uma matriz de sequências repetitivas (repetições, dia marrom.

Figura 2: O mecanismo de engenharia de genoma mediada por CRISPR-Cas9. A estrutura de sgRNA sintético ou crRNA-tracrRNA direciona uma endonuclease Cas9 a uma sequência de DNA quase arbitrária no genoma por meio de um.

Figura 3: Estrutura geral de Streptococcus pyogenes Cas9 (SpyCas9) no estado apo. (a) Representação em fita da estrutura cristalina do SpyCas9 (PDB ID 4CMP). Os domínios Cas9 individuais são coloridos.

Figura 4: Guia de carregamento de RNA permite que Cas9 forme uma conformação competente de reconhecimento de DNA para busca de alvos. (a) Diagrama de fita mostrando a estrutura apo de SpyCas9 alinhada na mesma orientação que.

Figura 5: Estruturas de CRISPR-Cas9 ligadas a substratos de DNA, mostrando a mesma vista da Figura 4c após a sobreposição. (a) Estrutura cristalina de SpyCas9 (representação de superfície) em complexo com sgRNA.

Figura 6: Representações esquemáticas dos mecanismos propostos de reconhecimento e clivagem de DNA alvo mediado por CRISPR-Cas9. Após o carregamento de sgRNA, Cas9 sofre um grande rearranjo conformacional para r.

Figura 7: As estruturas dos ortólogos Cas9 revelam as características estruturais conservadas e divergentes entre os sistemas ortólogos CRISPR-Cas9. Os domínios Cas9 individuais são coloridos de acordo com o esquema em.



Comentários:

  1. Mames

    Algo assim não aparece

  2. Zdenek

    eu considero, que você cometeu um erro. Vamos discutir isso. Escreva para mim em PM, vamos conversar.

  3. Clinttun

    Tema correspondente ....

  4. Royns

    Obrigado pela informação! Interessante!



Escreve uma mensagem