Busca avançada
Ano de início
Entree

Aprendizado não supervisionado multidescrição em agrupamento hierárquico e incremental de textos

Processo: 10/20564-8
Modalidade de apoio:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de junho de 2011
Vigência (Término): 28 de fevereiro de 2013
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Sistemas de Computação
Pesquisador responsável:Solange Oliveira Rezende
Beneficiário:Ricardo Marcondes Marcacini
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Inteligência computacional   Mineração de texto   Aprendizado computacional   Algoritmos   Agrupamento incremental de documentos
Palavra(s)-Chave do Pesquisador:Agrupamento de Documentos | Agrupamento Incremental | Aprendizado Multidescrição | Mineração de Textos | Inteligência Computacional

Resumo

Métodos de agrupamento hieráquico e incremental de textos são úteis para organização não supervisionada de coleções textuais dinâmicas em grupos, sumarizando o conhecimento implícito nos textos. Nestes métodos, o agrupamento resultante é disposto de maneira hierárquica, em que grupos e subgrupos representam um tópico de conhecimento da coleção, provendo um meio intuitivo para explorar o conhecimento. Ainda, eles possiblitam a incorporação de novo conhecimento sem reprocessamento redundante, uma vez que apenas informações inseridas, removidas ou atualizadas são consideradas, ou seja, o agrupamento é realizado de maneira incremental. No entanto, as abordagens existentes para agrupamento hierárquico e incremental possuem limitações que afetam a qualidade dos resultados. Entre as limitações, um problema relevante ocorre durante a tarefa incremental: quando novos documentos apresentados ao agrupamento são alocados em grupos errados, este erro é propagado para as próximas iterações e faz com que o modelo final tenha seu desempenho degradado. Esse problema é típico em agrupamento incremental e explorar formas de solucioná-lo é útil e necessário para diversas aplicações relacionadas à organização de informação. Ainda, as coleções de textos podem ser representadas por diferentes meios, no qual conjuntos de informações diferentes se referem ao mesmo documento, e cada conjunto de informação é capaz de descrever de maneira independente o documento de interesse. Assim, uma direção importante de pesquisa, denominada aprendizado multidescrição, foca em usar as diferentes descrições dos textos para aumentar a confiança de uma tarefa de aprendizado, porém, é uma tema em aberto e não explorado em agrupamento incremental. Desta forma, o presente projeto de doutorado visa investigar o uso de aprendizado multidescricão em tarefas de agrupamento hierárquico e incremental, com foco em coleções de textos dinâmicas e, assim, explorar de maneira efetiva as várias descrições dos textos para aumentar a qualidade do agrupamento hierárquico incremental. A ideia se baseia no princípio de maximização do consenso entre múltiplas hipóteses, que considera que o aprendizado é melhorado utilizando o consenso de todas descrições do conjunto de dados. Com isto, espera-se oferecer uma nova abordagem para agrupamento hierárquico e incremental de textos capaz de manter a representação do conhecimento sempre válida e atualizada e permitindo a descoberta de conhecimento nos cenários atuais, caracterizados pela alta frequência de publicação e atualização das informações (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
SINOARA, ROBERTA A.; SUNDERMANN, CAMILA V.; MARCACINI, RICARDO M.; DOMINGUES, MARCOS A.; REZENDE, SOLANGE O.; ALMEIDA, A; BERNARDINO, J; GOMES, EF. Named Entities as Privileged Information for Hierarchical Text Clustering. PROCEEDINGS OF THE 18TH INTERNATIONAL DATABASE ENGINEERING AND APPLICATIONS SYMPOSIUM (IDEAS14), v. N/A, p. 10-pg., . (13/16039-3, 13/14757-6, 10/20564-8, 12/13830-9)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
MARCACINI, Ricardo Marcondes. Aprendizado de máquina com informação privilegiada: abordagens para agrupamento hierárquico de textos. 2014. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB) São Carlos.

Por favor, reporte erros na lista de publicações científicas utilizando este formulário.