Inteligência Artificial Catalisa Pesquisa de Ativação de Genes e Revela Raras Sequências de DNA

Pesquisas em Saúde - Por José Roberto Abramo

23/05/2023

Demonstração científica com aprendizado de máquina revela sequências de DNA ‘extremos’ com atividades personalizadas.

18 de maio de 2023

por Mario Aguilera

maguilera@ucsd.edu

A inteligência artificial explodiu em nossos feeds de notícias, com o ChatGPT e as tecnologias de IA relacionadas se tornando o foco do amplo escrutínio público. Além dos chatbots populares, os biólogos estão encontrando maneiras de alavancar a IA para investigar as principais funções de nossos genes.

Anteriormente, pesquisadores da Universidade da Califórnia em San Diego, que investigavam sequências de DNA que ativam genes, usavam inteligência artificial para identificar uma peça enigmática do quebra-cabeça ligada à ativação genética, um processo fundamental envolvido no crescimento, desenvolvimento e doenças. Usando aprendizado de máquina, um tipo de inteligência artificial, o professor da Escola de Ciências Biológicas James T. Kadonaga e seus colegas descobriram a região promotora do núcleo downstream (DPR) , um código de ativação de DNA de “porta de entrada” que está envolvido na operação de até um terço do nossos genes.

Com base nessa descoberta, Kadonaga e os pesquisadores Long Vo ngoc e Torrey E. Rhyne agora usaram o aprendizado de máquina para identificar sequências de DNA “extremas sintéticas” com funções especificamente projetadas na ativação de genes. Publicando na revista Genes & Development , os pesquisadores testaram milhões de diferentes sequências de DNA por meio de aprendizado de máquina (IA), comparando o elemento de ativação do gene DPR em humanos versus moscas-das-frutas ( Drosophila ). Usando IA, eles conseguiram encontrar sequências DPR raras e personalizadas que são ativas em humanos, mas não em moscas-das-frutas e vice-versa. De maneira mais geral, essa abordagem agora pode ser usada para identificar sequências sintéticas de DNA com atividades que podem ser úteis em biotecnologia e medicina.

“No futuro, essa estratégia poderá ser usada para identificar sequências de DNA extremas sintéticas com aplicações práticas e úteis. Em vez de comparar humanos (condição X) com moscas-das-frutas (condição Y), poderíamos testar a capacidade da droga A (condição X), mas não da droga B (condição Y) de ativar um gene”, disse Kadonaga, um distinto professor do Departamento de Biologia Molecular. “Esse método também pode ser usado para encontrar sequências de DNA personalizadas que ativam um gene no tecido 1 (condição X), mas não no tecido 2 (condição Y). Existem inúmeras aplicações práticas dessa abordagem baseada em IA. As sequências de DNA extremas sintéticas podem ser muito raras, talvez uma em um milhão – se existirem, podem ser encontradas usando IA.”

O aprendizado de máquina é um ramo da IA ​​no qual os sistemas de computador melhoram e aprendem continuamente com base em dados e experiências. Na nova pesquisa, Kadonaga, Vo ngoc (um ex-pesquisador de pós-doutorado da UC San Diego agora na Velia Therapeutics) e Rhyne (um associado de pesquisa da equipe) usaram um método conhecido como regressão de vetor de suporte para “treinar” modelos de aprendizado de máquina com 200.000 sequências de DNA estabelecidas com base em dados de experimentos de laboratório do mundo real. Esses foram os alvos apresentados como exemplos para o sistema de aprendizado de máquina. Eles então “alimentaram” 50 milhões de sequências de DNA de teste nos sistemas de aprendizado de máquina para humanos e moscas-da-fruta e pediram que comparassem as sequências e identificassem sequências únicas dentro dos dois enormes conjuntos de dados.

Embora os sistemas de aprendizado de máquina mostrassem que as sequências humanas e de moscas-das-frutas se sobrepunham amplamente, os pesquisadores se concentraram na questão central de saber se os modelos de IA poderiam identificar casos raros em que a ativação de genes é altamente ativa em humanos, mas não em moscas-das-frutas. A resposta foi um sonoro “sim”. Os modelos de aprendizado de máquina conseguiram identificar sequências de DNA específicas para humanos (e específicas para moscas-da-fruta). É importante ressaltar que as funções preditas pela IA das sequências extremas foram verificadas no laboratório de Kadonaga usando métodos de teste convencionais (laboratório úmido).

“Antes de embarcar neste trabalho, não sabíamos se os modelos de IA eram ‘inteligentes’ o suficiente para prever as atividades de 50 milhões de sequências, particularmente sequências ‘extremas’ discrepantes com atividades incomuns. Portanto, é muito impressionante e bastante notável que os modelos de IA possam prever as atividades das raras sequências extremas de um em um milhão”, disse Kadonaga, que acrescentou que seria essencialmente impossível conduzir os 100 milhões de experimentos de laboratório úmido comparáveis. que a tecnologia de aprendizado de máquina analisada já que cada experimento de laboratório úmido levaria quase três semanas para ser concluído.

As raras sequências identificadas pelo sistema de aprendizado de máquina servem como uma demonstração bem-sucedida e preparam o terreno para outros usos do aprendizado de máquina e outras tecnologias de IA na biologia.

“Na vida cotidiana, as pessoas estão encontrando novos aplicativos para ferramentas de IA, como o ChatGPT. Aqui, demonstramos o uso de IA para o design de elementos de DNA personalizados na ativação de genes. Esse método deve ter aplicações práticas em biotecnologia e pesquisa biomédica”, disse Kadonaga. “De forma mais ampla, os biólogos provavelmente estão no início de explorar o poder da tecnologia de IA.”

Financiamento dos Institutos Nacionais de Saúde (R35 GM118060) apoiou a pesquisa.

Este artigo foi escrito pelo diretor de Comunicações para Ciências Biológicas da UC San Diego Today, Mario Aguilera.

LEIA TAMBÉM:

Compartilhe: