Busca avançada
Ano de início
Entree

Exploração do espaço químico via aprendizado semissupervisionado para geração de novos materiais

Processo: 22/09285-7
Modalidade de apoio:Auxílio à Pesquisa - Regular
Vigência: 01 de março de 2023 - 28 de fevereiro de 2025
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Marcos Gonçalves Quiles
Beneficiário:Marcos Gonçalves Quiles
Instituição Sede: Instituto de Ciência e Tecnologia (ICT). Universidade Federal de São Paulo (UNIFESP). Campus São José dos Campos. São José dos Campos , SP, Brasil
Pesquisadores associados:Juarez Lopes Ferreira da Silva ; Ronaldo Cristiano Prati
Assunto(s):Aprendizado computacional  Aprendizado semissupervisionado  Redes neurais (computação)  Desenvolvimento de novos materiais 
Palavra(s)-Chave do Pesquisador:Aprendizado Semissupervisionado | autoencoders | design de materiais | Predicao de Propriedades | Redes neurais | Aprendizado de Máquina

Resumo

A descoberta de novos materiais está diretamente ligada a evolução da sociedade. Estes materiais podem permitir desde a geração novos fármacos até o desenvolvimento de componentes eletrônicos para geração de energias limpas. Destaca-se que além dos diversos materiais já disponíveis na natureza, há uma infinidade de compostos que podem ser, teoricamente, gerados a partir da combinação de elementos químicos básicos. Contudo, esse espaço de possibilidade, denominado espaço químico, é praticamente infinito, inviabilizando um escrutínio completo de todas as possibilidades. Com o objetivo de facilitar a busca por novos materiais, especialistas têm feito uso de diversas técnicas de aprendizado de máquina (AM). No processo direto, técnicas de AM podem ser treinadas e usadas para predizer propriedades específicas de novos materiais. Por outro lado, técnicas de AM também podem ser usadas no denominado design inverso, no qual o modelo é treinado para gerar novos compostos a partir de propriedades desejadas. Dentre as diversas técnicas de AM disponíveis na literatura, o treinamento de modelos generativos baseados em autoencoders tem mostrado resultados promissores. Recentemente, propusemos um modelo generativo, denominado Autoencoder Variacional Gramatical Supervisionado (SGVAE). Este modelo é capaz de realizar as duas tarefas descritas acima: predição de propriedades e design de novas moléculas. Entretanto, este modelo, assim como outros da literatura, possuem limitações e restrições de uso, como por exemplo: a) a maioria dos modelos são intrinsicamente supervisionados; b) carecem de um estudo amplo sobre representações moleculares; c) geração de espaços latentes com baixa navegabilidade (amostragem) e interpretação; d) falta de uma metodologia para adaptação contínua do modelo em cenários nos quais novos dados são constantemente adicionados a base de dados; e e) validação dos modelos em cenários reais. Neste sentido, com o objetivo de responder algumas das perguntas expostas, serão estudados e desenvolvidos novos modelos baseados em Autoencoders Variacionais (VAE) para geração de materiais considerando múltiplas representações. O treinamento dos modelos seguirá o paradigma semissupervisionado, no qual os dados são parcialmente rotulados. Além disso, técnicas de aprendizado ativo também serão consideradas para melhorar a eficiência no uso dos dados rotulados e exploração contínua do espaço químico. Com o objetivo de melhorar a interpretação química/física da representação latente aprendida, será realizada uma análise qualitativa e quantitativa dos VAEs. Os modelos serão avaliados utilizando conjuntos de dados públicos e dados gerados no contexto do CINE (Center for Innovation on New Energies). Por fim, destaca-se que este projeto está vinculado a divisão computacional do CINE (4), no qual o proponente é um dos pesquisadores principais (Proc. 2017/11631-2). (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)