Proteínas sintéticas criadas em estudos com inteligência artificial

Proteínas sintéticas criadas em estudos com inteligência artificial

Usando modelo de IA pré-treinado da NVIDIA, a startup Evozyne criou duas proteínas com potencial significativo na área da saúde e da energia limpa. O artigo conjunto, divulgado nesta quinta-feira (12), descreve o processo e os elementos biológicos básicos produzidos. Uma das proteínas tem como objetivo curar uma doença congênita; e a outra foi projetada para consumir dióxido de carbono e combater o aquecimento global. Além disso, os resultados iniciais mostram uma nova maneira de acelerar a descoberta de medicamentos e outras diversas pesquisas.

“É muito encorajador que, mesmo nesta primeira rodada, o modelo de IA tenha produzido proteínas sintéticas tão boas quanto as que ocorrem naturalmente”, afirmou Andrew Ferguson, co-fundador da Evozyne e co-autor do artigo. “Isso nos diz que ela aprendeu corretamente as regras de desenvolvimento da natureza.”

O futuro das proteínas sintéticas passa pela IA

Para o estudo de proteínas sintéticas, a Evozyne usou a implementação do ProtT5, um modelo transformer que faz parte do NVIDIA BioNeMo, o framework de softwares da NVIDIA que usa a criação de modelos de IA para a área da saúde. O modelo está no centro do processo da Evozyne, chamado ProT-VAE, um workflow que combina o BioNeMo com um autocodificador variacional, funcionando como um filtro.

“O uso de grandes modelos de linguagem combinados com autocodificadores variacionais para desenvolver proteínas não estava no radar de ninguém há alguns anos. O BioNeMo nos ofereceu tudo o que precisávamos para sustentar o treinamento de modelos e, depois, executar trabalhos com o modelo de maneira muito barata. Conseguimos gerar milhões de sequências em apenas alguns segundos”, afirma Ferguson, engenheiro molecular que trabalha na intersecção da química com machine learning.

Como um aluno lendo um livro, o modelo transformer da NVIDIA lê sequências de aminoácidos em milhões de proteínas. Usando as mesmas técnicas que as redes neurais empregam para entender o texto (leia mais no item 1. “Inteligência artificial avançada”), ele aprendeu como a natureza monta os elementos básicos da biologia. O modelo então previu como montar novas proteínas adequadas para as funções que a Evozyne quer abordar. “A tecnologia está nos permitindo concretizar o que parecia um sonho impossível há 10 anos atrás”, explica.

Novas proteínas e um mar de possibilidades

A criação de proteínas em tempo recorde é um feito incrível e pode impactar no tratamento de diversas doenças, como — por exemplo — a terapia gênica da Doença de Parkinson (veja mais aqui). Isso acontece porque é possível passar por um número astronômico de sequências proteicas possíveis e, em seguida, identifica quais as mais úteis e sua eficiência.

O método tradicional de engenharia de proteína, chamado de evolução dirigida, usa uma abordagem lenta e incerta. Normalmente, ele só altera alguns aminoácidos em sequência para cada experimento, fazendo com que sejam necessários diversos testes e muito mais tempo.

Em contraste, a abordagem utilizada pela Evozyne pode alterar metade ou mais dos aminoácidos em uma proteína durante uma única rodada. Isso é o equivalente a fazer centenas de mutações. “Estamos dando grandes saltos, o que nos permite explorar proteínas inéditas com funções novas e úteis”, afirma Ferguson.

As novas tecnologias no campo da saúde

“A NVIDIA é uma parceira incrível nesse trabalho”, afirma. “Eles dimensionaram trabalhos para várias GPUs acelerando o treinamento”, afirma Joshua Moller, cientista de dados da Evozyne. “Analisamos conjuntos de dados inteiros em um minuto. Isso reduziu o tempo de treinamento de grandes modelos de IA de meses para uma semana, permitindo treinar modelos, alguns com bilhões de parâmetros, que simplesmente não seria possível de outra forma”, conta Ferguson.

Para os interessados em ter acesso antecipado ao NVIDIA BioNeMo e para ver como ele pode acelerar suas aplicações, é possível se inscrever neste link.

O horizonte da engenharia de proteínas acelerada por IA é amplo e deve nos levar a saltos exponenciais em vários campos das ciências biológicas. “O segmento está se movendo extremamente rápido e estou muito animado para ver o que virá por aí. Quem sabe onde estaremos daqui a cinco anos?”, finaliza Ferguson.

Imagem Destaque: SciePro/Shutterstock

Compartilhe esse artigo: