Um dos maiores mistérios da biologia foi resolvido usando inteligência artificial, anunciaram especialistas.
Prever como uma proteína adquire uma forma tridimensional única intrigou os cientistas por meio século. Agora, o laboratório de inteligência artificial DeepMind, que pertence ao Google e tem sede em Londres, resolveu o problema, dizem os organizadores de um desafio científico.
Leia também:
Uma melhor compreensão das formas das proteínas pode desempenhar um papel fundamental no desenvolvimento de novos medicamentos para o tratamento de doenças.
Espera-se que esse avanço acelere pesquisas sobre uma série de doenças, incluindo a covid-19.
O programa determinou a forma das proteínas em um nível de precisão comparável a métodos de laboratório caros e demorados, segundo o anúncio.
Andriy Kryshtafovych, da Universidade da Califórnia em Davis, nos Estados Unidos, é um dos jurados científicos e descreveu o feito como “verdadeiramente notável”.
“Ser capaz de investigar a forma das proteínas com rapidez e precisão tem o potencial de revolucionar as ciências da vida”, disse ele.
O que são proteínas?
As proteínas estão presentes em todos os seres vivos, onde desempenham um papel central nos processos químicos essenciais para a vida.
Compostos por cadeias de aminoácidos, eles se dobram em um número infinito de maneiras em formas elaboradas que contêm a chave sobre como realizam suas funções vitais.
Muitas doenças estão ligadas ao papel das proteínas na catalisação de reações químicas (enzimas), no combate a doenças (anticorpos) ou na atuação como mensageiros químicos (hormônios como a insulina).
“Mesmo pequenos rearranjos dessas moléculas vitais podem ter efeitos catastróficos em nossa saúde, então uma das maneiras mais eficientes de entender a doença e encontrar novos tratamentos é estudar as proteínas envolvidas”, disse John Moult, da Universidade de Maryland, EUA.
“Existem dezenas de milhares de proteínas humanas e muitos bilhões em outras espécies, incluindo bactérias e vírus, mas descobrir a forma de apenas uma requer equipamentos caros e pode levar anos”.
Como foi o desafio científico?
Em 1972, Christian Anfinsen recebeu o Prêmio Nobel por seu trabalho mostrando que deveria ser possível determinar a forma das proteínas com base na sequência de seus blocos de aminoácidos.
A cada dois anos, dezenas de equipes de mais de 20 países tentam cegamente prever, usando computadores, a forma de um conjunto de cerca de 100 proteínas a partir de suas sequências de aminoácidos.
Ao mesmo tempo, as estruturas 3D são trabalhadas em laboratório por biólogos usando técnicas tradicionais como cristalografia de raios-X e espectroscopia por ressonância magnética nuclear (também chamada de espectroscopia por RMN), que determinam a localização de cada átomo em relação a outro na molécula de proteína.
Uma equipe de cientistas do Casp (experimento comunitário sobre a avaliação crítica de técnicas para predição de estrutura de proteínas) compara essas previsões com as estruturas 3D encontradas usando os métodos experimentais.
O Casp usa uma métrica conhecida como teste de distância global para avaliar a precisão, variando de 0 a 100. Uma pontuação de cerca de 90, que o programa AlphaFold da DeepMind alcançou, é considerada comparável às técnicas de laboratório.
O que aconteceu este ano?
Na última rodada do desafio Casp-14, o AlphaFold determinou a forma de cerca de dois terços das proteínas com precisão comparável a experimentos de laboratório.
Os avaliadores disseram que a precisão com a maioria das outras proteínas também era alta, embora não tenham chegado a esse nível.
AlphaFold é baseado em um conceito denominado aprendizado profundo. Nesse processo, a estrutura de uma proteína dobrada é representada como um gráfico espacial.
O programa então “aprende” usando informações sobre as formas 3D de proteínas conhecidas mantidas no Banco de Dados Público de Proteínas.
O programa de Inteligência Artificial foi capaz de fazer em questão de dias o que poderia levar anos em uma bancada de laboratório.
Como essa informação será usada?
Conhecer a estrutura 3D de uma proteína é importante na fabricação de medicamentos e na compreensão de doenças humanas, incluindo câncer, demência e doenças infecciosas.
Um exemplo é a covid-19, em que os cientistas estudam como a proteína spike (ou “de pico”) na superfície do vírus Sars-CoV-2 interage com os receptores nas células humanas.
O professor Andrew Martin, da University College London (UCL), ex-participante e assessor do Casp, disse à BBC News: “Entender como uma sequência de proteína se dobra em três dimensões é realmente uma das questões fundamentais da biologia. Toda a maneira como uma proteína funciona depende de sua estrutura tridimensional e a função da proteína é relevante para tudo na saúde e na doença”.
“Conhecendo as estruturas tridimensionais das proteínas, podemos ajudar a projetar medicamentos e intervir em problemas de saúde, sejam infecções ou doenças hereditárias.”
A professora Dame Janet Thornton, do Instituto Europeu de Bioinformática da EMBL no Reino Unido, disse que a forma como as proteínas se dobram para criar “estruturas tridimensionais extraordinariamente exclusivas” é um dos maiores mistérios da biologia.
“Uma melhor compreensão das estruturas das proteínas e a capacidade de prevê-las usando um computador significa uma melhor compreensão da vida, da evolução e, claro, da saúde e das doenças humanas”, explicou ela.
O que acontece agora?
Outros cientistas vão querer olhar os dados para determinar o quão preciso é o método de Inteligência Artificial e quão bem ele funciona em um nível muito detalhado.
Ainda há uma lacuna de conhecimento, incluindo descobrir como várias proteínas se encaixam e como as proteínas interagem com outras moléculas, como DNA e RNA.
“Agora que o problema foi amplamente resolvido para proteínas individuais, o caminho está aberto para o desenvolvimento de novos métodos para determinar a forma de complexos de proteínas — coleções de proteínas que trabalham juntas para formar grande parte da maquinaria da vida e para outras aplicações”disse Kryshtafovych.
Fonte: BBC