Os cientistas aplicaram com sucesso o aprendizado por reforço a um desafio na biologia molecular.
A equipe de pesquisadores desenvolveu um novo e poderoso software de design de proteínas adaptado de uma estratégia comprovadamente adepta de jogos de tabuleiro como Xadrez e Go. Em um experimento, as proteínas feitas com a nova abordagem foram consideradas mais eficazes na geração de anticorpos úteis em camundongos.
As descobertas, relatadas em 21 de abril na Ciência, sugerem que esse avanço pode levar a vacinas mais potentes em breve. De forma mais ampla, a abordagem pode levar a uma nova era no design de proteínas.
“Nossos resultados mostram que o aprendizado por reforço pode fazer mais do que dominar jogos de tabuleiro. Quando treinado para resolver quebra-cabeças de longa data na ciência de proteínas, o software se destacou na criação de moléculas úteis”, disse o autor sênior David Baker, professor de bioquímica na UW School of Medicine em Seattle e recebeu o Prêmio Breakthrough de 2021 em Ciências da Vida.
“Se este método for aplicado aos problemas de pesquisa corretos”, disse ele, “poderá acelerar o progresso em vários campos científicos”.
A pesquisa é um marco no uso da inteligência artificial para conduzir pesquisas científicas de proteínas. As aplicações potenciais são vastas, desde o desenvolvimento de tratamentos de câncer mais eficazes até a criação de novos tecidos biodegradáveis.
O aprendizado por reforço é um tipo de aprendizado de máquina no qual um programa de computador aprende a tomar decisões tentando diferentes ações e recebendo feedback. Tal algoritmo pode aprender a jogar xadrez, por exemplo, testando milhões de movimentos diferentes que levam à vitória ou derrota no tabuleiro. O programa é projetado para aprender com essas experiências e tornar-se melhor na tomada de decisões ao longo do tempo.
Para criar um programa de aprendizado por reforço para o design de proteínas, os cientistas forneceram ao computador milhões de moléculas iniciais simples. O software então fez dez mil tentativas para melhorar aleatoriamente cada uma em direção a uma meta predefinida. O computador alongou as proteínas ou as dobrou de maneiras específicas até aprender a contorcê-las nas formas desejadas.
Isaac D. Lutz, Shunzhi Wang e Christoffer Norn, todos membros do Baker Lab, lideraram a pesquisa. O manuscrito científico de sua equipe é intitulado “Design de arquiteturas de proteínas de cima para baixo com aprendizado por reforço”.
“Nossa abordagem é única porque usamos o aprendizado por reforço para resolver o problema de criar formas de proteínas que se encaixam como peças de um quebra-cabeça”, explicou o coautor Lutz, aluno de doutorado do UW Medicine Institute for Protein Design. “Isso simplesmente não era possível usando abordagens anteriores e tem o potencial de transformar os tipos de moléculas que podemos construir”.
Como parte deste estudo, os cientistas fabricaram centenas de proteínas projetadas por IA no laboratório. Usando microscópios eletrônicos e outros instrumentos, eles confirmaram que muitas das formas de proteínas criadas pelo computador foram de fato realizadas em laboratório.
“Essa abordagem se mostrou não apenas precisa, mas também altamente personalizável. Por exemplo, pedimos ao software para fazer estruturas esféricas sem buracos, pequenos buracos ou grandes buracos. Seu potencial para fazer todos os tipos de arquiteturas ainda não foi totalmente explorado.” disse o co-autor Shunzhi Wang, um pós-doutorando no UW Medicine Institute for Protein Design.
A equipe se concentrou em projetar novas estruturas em nanoescala compostas por muitas moléculas de proteína. Isso exigiu projetar os próprios componentes da proteína e as interfaces químicas que permitem que as nanoestruturas se automontem.
A microscopia eletrônica confirmou que numerosas nanoestruturas projetadas por IA foram capazes de se formar no laboratório. Como uma medida de quão preciso o software de design se tornou, os cientistas observaram muitas nanoestruturas únicas nas quais cada átomo foi encontrado no local pretendido. Em outras palavras, o desvio entre a nanoestrutura pretendida e a realizada foi, em média, menor que a largura de um único átomo. Isso é chamado de design atomicamente preciso.
Os autores prevêem um futuro em que esta abordagem poderia permitir que eles e outros criem proteínas terapêuticas, vacinas e outras moléculas que não poderiam ter sido feitas usando métodos anteriores.
Pesquisadores do UW Medicine Institute for Stem Cell and Regenerative Medicine usaram modelos celulares primários de vasos sanguíneos para mostrar que os andaimes de proteína projetados superaram as versões anteriores da tecnologia. Por exemplo, como os receptores que ajudam as células a receber e interpretar os sinais foram agrupados de forma mais densa nos andaimes mais compactos, eles foram mais eficazes na promoção da estabilidade dos vasos sanguíneos.
Hannele Ruohola-Baker, professora de bioquímica da Escola de Medicina da UW e uma das autoras do estudo, falou sobre as implicações da investigação para a medicina regenerativa: “Quanto mais precisa a tecnologia se torna, mais ela abre aplicações potenciais, incluindo tratamentos vasculares para diabetes, lesões cerebrais, derrames e outros casos em que os vasos sanguíneos estão em risco. Também podemos imaginar a entrega mais precisa de fatores que usamos para diferenciar as células-tronco em vários tipos de células, dando-nos novas maneiras de regular os processos de desenvolvimento celular e envelhecimento”.
Este trabalho foi financiado pelos Institutos Nacionais de Saúde (P30 GM124169, S10OD018483, 1U19AG065156-01, T90 DE021984, 1P01AI167966); Open Philanthropy Project e The Audacious Project no Institute for Protein Design; Fundação Novo Nordisk (NNF170C0030446); Microsoft; e Amgen. A pesquisa foi parcialmente conduzida na Advanced Light Source, uma instalação nacional de usuários operada pelo Lawrence Berkeley National Laboratory em nome do Departamento de Energia
Comunicado de imprensa escrito por Ian Haydon, UW Medicine Institute for Protein Design.