Bolsa 24/16562-2 - Aprendizado computacional - BV FAPESP
Busca avançada
Ano de início
Entree

Determinando limites empíricos de uma incorporação da dificuldade de um conjunto de dados utilizando o framework Instance Space Analysis

Processo: 24/16562-2
Modalidade de apoio:Bolsas no Exterior - Estágio de Pesquisa - Iniciação Científica
Data de Início da vigência: 07 de dezembro de 2024
Data de Término da vigência: 06 de março de 2025
Área de conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ana Carolina Lorena
Beneficiário:Diogo Bueno Rodrigues
Supervisor: Kate Smith-Miles
Instituição Sede: Divisão de Ciência da Computação (IEC). Instituto Tecnológico de Aeronáutica (ITA). Ministério da Defesa (Brasil). São José dos Campos , SP, Brasil
Instituição Anfitriã: University of Melbourne, Austrália  
Vinculado à bolsa:24/07655-7 - Análise de meta-datasets em nível de instância, BP.IC
Assunto(s):Aprendizado computacional
Palavra(s)-Chave do Pesquisador:Instance Space Analysis | machine learning | Meta-data | meta-learning | Análise de meta dados

Resumo

O aprendizado de máquina sem dúvida transformou a pesquisa em ciência da computação, promovendo avanços tecnológicos significativos ao permitir que os computadores aprendam com dados, tomem decisões e reconheçam padrões de forma autônoma. Embora existam inúmeros algoritmos de aprendizado de máquina (ML), já foi demonstrado que nenhum algoritmo é superior em todos os conjuntos de dados possíveis. Portanto, um processo eficaz de seleção de algoritmos é essencial, e a meta-aprendizagem pode ser crucial para isso. Estudos de meta-aprendizagem ajudam a identificar características-chave dos conjuntos de dados, especialmente para tarefas de classificação, e relacioná-las com informações sobre o desempenho dos algoritmos de ML. Um framework que apoia tal processo de seleção é o Instance Space Analysis (ISA), desenvolvido na Universidade de Melbourne. O ISA é único em sua capacidade de visualizar o desempenho dos algoritmos em um plano 2D, proporcionando uma compreensão mais clara de como diferentes algoritmos se comportam. Essa visualização oferece insights valiosos que podem ajudar a melhorar o desempenho dos algoritmos e a representatividade dos conjuntos de dados. Em trabalhos colaborativos anteriores, os grupos brasileiros e australianos instanciaram o ISA para produzir uma incorporação de dificuldade de um conjunto de dados de classificação em ML. Esta proposta visa destacar os benefícios da metodologia ISA nesse contexto e a importância de implementar totalmente o conjunto de ferramentas ISA em uma versão em Python, com o apoio de seus desenvolvedores na Universidade de Melbourne. Mais especificamente, concentrar-se-á na implementação do módulo CLOISTER (Correlated Limits of the Instance Space's Theoretical or Experimental Regions) no pacote Python PyISpace. Este módulo permite delimitar regiões viáveis de um espaço de instâncias com base em evidências empíricas.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)