Bolsa 23/11391-2 - - BV FAPESP
Busca avançada
Ano de início
Entree

Combinando transcrição completa e pipelines de bioinformática para desvendar o potencial funcional e melhorar a anotação de retrocópias usando um conjunto de dados em escala populacional humana.

Processo: 23/11391-2
Modalidade de apoio:Bolsas no Exterior - Estágio de Pesquisa - Doutorado Direto
Data de Início da vigência: 30 de setembro de 2024
Data de Término da vigência: 29 de dezembro de 2024
Área de conhecimento:Ciências Biológicas - Bioquímica - Biologia Molecular
Pesquisador responsável:Pedro Alexandre Favoretto Galante
Beneficiário:Rafael Luiz Vieira Mercuri
Supervisor: Melina Claussnitzer
Instituição Sede: Hospital Sírio-Libanês. Sociedade Beneficente de Senhoras (SBSHSL). São Paulo , SP, Brasil
Instituição Anfitriã: Broad Institute, Estados Unidos  
Vinculado à bolsa:20/02413-4 - Retrocópias intragênicas como fonte de novos domínios proteicos em humanos, BP.DD
Palavra(s)-Chave do Pesquisador:annotation | expression | Long-reads | MAS-ISO-Seq | retrocopies | Elementos Móveis

Resumo

As retrocópias, também conhecidas como pseudogenes processados, surgem da transcrição reversa e posterior integração de moléculas de RNA mensageiro (mRNA) no genoma. Embora muitas retrocópias tenham sido historicamente consideradas pseudogenes não funcionais, os avanços nas tecnologias das ômicas e na bioinformática revelaram uma miríade de retrocópias potencialmente funcionais. O genoma humano compreende aproximadamente 8.000 retrocópias fixas, com estudos em larga escala indicando que mais de 40% delas são ativamente transcritas. Compreender o impacto e a função das retrocópias no genoma humano é fundamental para destacar seus papéis potenciais no desenvolvimento de doenças e nas vias evolutivas. Embora o sequenciamento de RNA tenha se mostrado instrumental na identificação de retrocópias expressas, o comprimento limitado dessas leituras restringe nossa capacidade de verificar transcrições completas de retrocópias. Como a maioria das retrocópias são cópias parciais de genes e algumas embutidas nos íntrons de genes codificadores de proteínas, a obtenção de seu comprimento total é crucial para elucidar suas funções. Somente os transcritos completos revelarão retrocópias codificantes (com CDS) e não codificantes, bem como os transcritos quiméricos formados entre as retrocópias e seus genes hospedeiros. A técnica/método MAS-ISO-seq oferece uma abordagem promissora para superar os obstáculos associados à identificação e quantificação de isoformas de RNA de comprimento total de alto rendimento em dados de célula única e em massa. Essa nova metodologia envolve a concatenação programável de DNAs complementares (cDNAs) em moléculas especializadas, ideais para o sequenciamento de leitura longa. Este projeto visa usar dados MAS-ISO-Seq para definir com precisão as regiões transcritas de retrocópias (pseudogenes processados) presentes no genoma humano, identificar aquelas retrocópias com potencial funcional (retrogenes) e construir um pipeline computacional para analisar a expressão de retrocópias com leituras longas. No final, acreditamos que uma compreensão mais profunda das retrocópias completas revelará novos (retro)genes, oferecendo novos insights sobre a evolução do genoma e identificando novas regiões genômicas associadas a doenças.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)