Busca avançada
Ano de início
Entree


Named Entities as Privileged Information for Hierarchical Text Clustering

Texto completo
Autor(es):
Sinoara, Roberta A. ; Sundermann, Camila V. ; Marcacini, Ricardo M. ; Domingues, Marcos A. ; Rezende, Solange O. ; Almeida, A ; Bernardino, J ; Gomes, EF
Número total de Autores: 8
Tipo de documento: Artigo Científico
Fonte: PROCEEDINGS OF THE 18TH INTERNATIONAL DATABASE ENGINEERING AND APPLICATIONS SYMPOSIUM (IDEAS14); v. N/A, p. 10-pg., 2014-01-01.
Resumo

Text clustering is a text mining task which is often used to aid the organization, knowledge extraction, and exploratory search of text collections. Nowadays, the automatic text clustering becomes essential as the volume and variety of digital text documents increase, either in social networks and the Web or inside organizations. This paper explores the use of named entities as privileged information in a hierarchical clustering process, so as to improve clusters quality and interpretation. We carried out an experimental evaluation on three text collections (one written in Portuguese and two written in English) and the results show that named entities can be applied as privileged information to power clustering solution in dynamic text collection scenarios. (AU)

Processo FAPESP: 13/16039-3 - Exploração de técnicas de mineração de textos para aquisição automática de informação contextual para sistemas de recomendações sensíveis ao contexto
Beneficiário:Camila Vaccari Sundermann
Modalidade de apoio: Bolsas no Brasil - Mestrado
Processo FAPESP: 13/14757-6 - Incorporação da semântica na construção de websensors
Beneficiário:Roberta Akemi Sinoara
Modalidade de apoio: Bolsas no Brasil - Doutorado
Processo FAPESP: 10/20564-8 - Aprendizado não supervisionado multidescrição em agrupamento hierárquico e incremental de textos
Beneficiário:Ricardo Marcondes Marcacini
Modalidade de apoio: Bolsas no Brasil - Doutorado
Processo FAPESP: 12/13830-9 - Aquisição Automática de Informação Contextual para Sistemas de Recomendação Sensíveis ao Contexto
Beneficiário:Marcos Aurelio Domingues
Modalidade de apoio: Bolsas no Brasil - Pós-Doutorado