Leer en español
A convergência de inteligência artificial (IA), modelos avançados de aprendizado de máquina e grandes bancos de dados de sequências de proteínas e informações biológicas tornou possível projetar proteínas que nunca existiram na natureza.
Semelhante a modelos generativos como o DALL-E 2, que pode gerar imagens a partir de grandes volumes de dados, um algoritmo na ciência pode recorrer a um vasto repositório de informações biológicas para criar proteínas que seguem padrões e princípios observados na natureza.
Essas novas proteínas têm funções sem precedentes e representam uma revolução na biotecnologia devido às potenciais aplicações médicas e ambientais que possibilitam.
David Baker, co-vencedor do Prêmio Nobel de Química de 2024, está desenvolvendo proteínas capazes de combater doenças como câncer e Alzheimer. Outros cientistas, por exemplo, trabalham em sua aplicação no desenvolvimento de vacinas e na preservação de alimentos.
No entanto, dado seu enorme potencial, o uso da IA para o desenvolvimento de novas proteínas também acarreta riscos significativos para a humanidade se for usado para criar toxinas, patógenos sintéticos ou moléculas com potencial destrutivo, representando um risco à segurança biológica global.
A mesma IA que pode desenvolver uma vacina também pode criar uma proteína que interfere em funções celulares críticas ou é altamente tóxica. Essa dualidade exige o estabelecimento de marcos regulatórios e éticos para controlar o acesso, o uso e a disseminação dessas ferramentas.
Por que as proteínas são tão importantes?
Dois cientistas do Google DeepMind , Demis Hassabis e John Jumper, desenvolveram um modelo de inteligência artificial para prever as estruturas complexas de proteínas, que são essenciais para a vida, alimentos, desenvolvimento de medicamentos e produção de biocombustíveis.
O modelo AlphaFold2 permitiu que cientistas decifrassem a estrutura de 200 milhões de proteínas, resolvendo um problema de 50 anos, enquanto tentativas de decodificar sua estrutura para entender como elas funcionam vêm sendo realizadas nas últimas décadas.
O formato ou dobramento de uma proteína define sua função biológica e estabilidade no corpo. Certas doenças foram identificadas como estando associadas ao dobramento incorreto de proteínas, portanto, compreender sua estrutura ajuda a corrigir esses erros.
E, paralelamente, David Baker, diretor do Instituto de Design de Proteínas da Universidade de Washington, conseguiu construir proteínas inteiramente novas que podem ser usadas como medicamentos, vacinas, nanomateriais e pequenos sensores.
Baker foi na direção oposta: em vez de decifrar a estrutura, ele optou por prevê-la com base na sequência de aminoácidos que compõem uma proteína, com a ajuda do Rosetta, um software de computador desenvolvido por seu laboratório.
Ambos os avanços no campo da biotecnologia representam um ponto de inflexão para a geração de proteínas com características específicas e a correção de problemas, como o tratamento de determinadas doenças.
Investimentos por trás do design de proteínas
Várias empresas e startups , como a Google DeepMind, estão investigando o uso de IA para acelerar o design de novas proteínas não vistas na natureza, com o objetivo de capitalizar as oportunidades de negócios que isso representa.
Em fevereiro deste ano, a Latent Labs — fundada pelo ex-pesquisador da DeepMind Simon Kohl — abriu o capital com US$ 50 milhões em financiamento para acelerar a construção de modelos de IA para gerar e otimizar proteínas.
Além disso, a EvolutionaryScale — uma startup formada por ex-cientistas da Meta — surgiu em junho de 2024 com uma rodada inicial de US$ 142 milhões de investidores, incluindo a NVentures, braço de investimentos da Nvidia, e a Amazon, de acordo com a Crunchbase.
A Cradle é outra startup —fundada pelo ex-engenheiro do Google Stef van Grieken—com foco em engenharia de proteínas, e arrecadou US$ 73 milhões para expandir seus laboratórios e equipe até o final de 2024.
Na China, a MoleculeMind é uma empresa de biotecnologia integrada à IA que busca acelerar o desenvolvimento de medicamentos e avançar em áreas como produção industrial e agrícola, design de materiais e melhoria ambiental. Embora o valor do financiamento seja desconhecido, a empresa já garantiu três rodadas de financiamento até o momento.
Há muitas outras empresas, algumas ainda anônimas, que estão investindo pesadamente no design de proteínas com tecnologia de IA, e por trás delas estão investidores-anjos de empresas de tecnologia e farmacêuticas, bem como grandes fundos de capital de risco.
Alguns governos também estão alocando fundos para impulsionar o design de proteínas. Em 7 de agosto, a Diretoria de Tecnologia, Inovação e Parcerias da Fundação Nacional de Ciências dos EUA liberou US$ 32 milhões para viabilizar novas aplicações relevantes para a bioeconomia.
Enquanto isso, a China lançou um Plano de Desenvolvimento de Inteligência Artificial de Próxima Geração em 2017, que inclui investimentos no uso de IA em aplicações biotecnológicas e farmacêuticas.
Riscos para a segurança biológica global
A inteligência artificial acelerou significativamente o design de proteínas. Anteriormente, os métodos utilizados nessa área exigiam milhares de experimentos de tentativa e erro, com enormes gastos de capital, recursos, tempo e pesquisa.
Hoje, a IA está sendo usada para projetar proteínas funcionais personalizadas com grande precisão e velocidade.
O progresso feito no design de proteínas usando inteligência artificial oferece um futuro promissor para a biotecnologia, com uma ampla gama de possibilidades de aplicação.
No entanto, isso também aumentou as preocupações entre a comunidade científica e especialistas sobre o potencial uso indevido ou malicioso.
O que antes exigia anos de trabalho de laboratório, milhões de dólares em financiamento e equipamentos altamente especializados agora pode ser alcançado por atores com treinamento intermediário, recursos limitados e, no pior dos casos, atores destrutivos.
Modelos de inteligência artificial treinados em dados biológicos podem ser mal utilizados para desenvolver ameaças químicas, biológicas, nucleares ou radiológicas; por exemplo, eles podem gerar novas doenças ou até mesmo desencadear outra pandemia como a COVID-19.
Para mitigar os riscos biológicos, é necessário estabelecer métodos específicos de avaliação de segurança da IA, visando evitar que um modelo produza sequências de proteínas potencialmente prejudiciais em apenas algumas horas com ajustes de treinamento.
David Baker e o geneticista George Church propõem que todos os dados de sequência e síntese de genes sintéticos sejam coletados e armazenados em repositórios e acessados apenas em situações de emergência.
Dessa forma, eles afirmam que é possível garantir que o design da proteína seja realizado de forma segura e confiável.
Na prática, esse registro atuaria como uma barreira à criação de biomoléculas nocivas a partir do design de proteínas, seja acidental ou intencional.
Além da criação de repositórios, políticas e estruturas também são necessárias para abordar o dilema de biossegurança imposto pelo design de proteínas.
Atualmente, de acordo com uma pesquisa realizada por um grupo de cientistas americanos , não há uma abordagem comum na indústria de IA para avaliar os riscos dos modelos biológicos de IA, e apenas alguns governos têm isso em suas agendas.
Atualmente, as preocupações sobre usos nocivos estão sendo abordadas principalmente por cientistas e especialistas em saúde pública por meio de pesquisas biológicas de uso duplo e patógenos com potencial pandêmico.
À medida que cresce o interesse econômico e comercial no design de proteínas de IA, como evidenciado pelas inúmeras empresas (públicas e privadas) investindo nesse campo, é crucial preservar o potencial