Pesquisa e Inovação: Desenvolvimento de um modelo analítico-preditivo baseado na integração de inteligência artificial e dados transcriptômicos aplicado à identificação de alvos moleculares de interesse (bio)farmacêutico
Busca avançada
Ano de início
Entree

Desenvolvimento de um modelo analítico-preditivo baseado na integração de inteligência artificial e dados transcriptômicos aplicado à identificação de alvos moleculares de interesse (bio)farmacêutico

Processo: 24/17577-3
Modalidade de apoio:Bolsas no Brasil - Pesquisa Inovativa em Pequenas Empresas - PIPE
Data de Início da vigência: 01 de outubro de 2024
Data de Término da vigência: 30 de setembro de 2026
Área de conhecimento:Interdisciplinar
Pesquisador responsável:Rodrigo Pinheiro Araldi
Beneficiário:Rodrigo Pinheiro Araldi
Empresa:Biodecision Analytics Ltda
CNAE: Consultoria em tecnologia da informação
Tratamento de dados, provedores de serviços de aplicação e serviços de hospedagem na internet
Pesquisa e desenvolvimento experimental em ciências físicas e naturais
Vinculado ao auxílio:24/07829-5 - Desenvolvimento de um modelo analítico-preditivo baseado na integração de inteligência artificial e dados transcriptômicos aplicado à identificação de alvos moleculares de interesse (bio)farmacêutico, AP.PIPE
Assunto(s):Biologia computacional   Análise de dados   Aprendizado computacional   Inteligência artificial   Análise de sequência de RNA   Descoberta de drogas   Alvo terapêutico
Palavra(s)-Chave do Pesquisador:Análise de Dados | bioinformática | Descoberta de alvos terapêuticos | Descoberta de drogas | machine learning | RNA-seq | Bioinformática

Resumo

O aumento global da incidência de doenças crônicas não transmissíveis tem incentivado a indústria farmacêutica a investir na pesquisa e desenvolvimento (P&D) de novas drogas capazes de prevenir ou tratar estas doenças. Entretanto, o desenvolvimento de uma droga é um processo demorado e custoso. Além disso, cerca de 90% dos produtos investigacionais em desenvolvimento fracassam durante os ensaios clínicos por apresentarem problemas de segura ou por carecerem de informações acerca do mecanismo de ação. Neste contexto, a transcriptômica tem permitido identificar alvos moleculares de interesse terapêutico, predizer o mecanismo de ação e até mesmo prever eventuais efeitos adversos. No entanto, os resultados provenientes da transcriptômica têm produzido grandes volumes de dados, os quais acabam sendo subutilizados ou utilizados de forma inapropriada. Isto porque: (i) em geral, os dados de sequenciamento de RNA (RNA-Seq) tendem a não ser correlacionados com variáveis clínicas e; (ii) quando correlacionados, por não utilizar métodos adequados, acabam trazendo correlações espúrias que impactam negativamente na P&D de fármaco. Além disso, (iii) devido a multidimensionalidade destes dados, o uso de técnicas estatísticas convencionais acaba, por vezes, levando a resultados de pouca relevância biológica. Neste sentido, a aplicação de técnicas de Data Analytics, incluindo inteligência artificial (IA), para integrar resultados clínicos (metadados) a dados transcriptômicos emerge como uma proposta promissora para vencer os desafios trazidos na era do Big Data. Neste sentido, indústrias farmacêuticas têm investido no desenvolvimento de estratégias analíticas mais inteligentes que permitam extrair informações de valor a partir de grandes volumes de dados acumulados ao longo da P&D de novas drogas. Por estas razões, esta proposta tem por objetivo investigar a viabilidade de um modelo analítico-preditivo (aqui denominado BDAseq) de interesse acadêmico e industrial que, ao integrar diferentes ferramentas de Data Analytics e IA, poderá identificar alvos terapêuticos de relevância. Para o desenvolvimento do BDAseq, este estudo usará dados públicos de RNA-Seq de áreas do cérebro (post-mortem) de pacientes portadores da doença de Huntington (DH, doença-modelo para o estudo de desordens neurodegenerativas) e indivíduos neurologicamente saudáveis e não portadores da mutação associada a DH. Os dados de RNA-Seq empregados neste estudo serão selecionados com base em técnicas de combinação de escore de propensão, que permitirão eligir as amostras mais adequadas com base em variáveis de relevância contidas nos metadados clínicos. A matriz de leitura bruta destas amostras será submetida a análise de expressão diferencial por sete diferentes métodos. Os resultados destes métodos serão combinados usando técnicas de ensemble. Os genes mais diferencialmente expressos serão correlacionados a variáveis clínicas de interesse usando técnicas supervisionadas de machine learning para identificação dos genes-alvo Estes alvos serão comparados os GDEs já identificados por estudos publicados. Os resultados obtidos permitirão testar a viabilidade do modelo BDAseq, trazendo perspectivas para comercializar o modelo na forma de um serviço ou mesmo resultar no desenvolvimento de um software user-friendly.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)