Busca avançada
Ano de início
Entree

Propagação em Grafos Bipartidos para Extração de Tópicos em Fluxo de Dados

Processo: 11/23689-9
Modalidade de apoio:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de junho de 2012
Vigência (Término): 10 de maio de 2016
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Alneu de Andrade Lopes
Beneficiário:Thiago de Paulo Faleiros
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):13/15353-6 - Avaliação do modelo sintático de tópico, BE.EP.DR
Assunto(s):Inteligência computacional   Mineração de texto
Palavra(s)-Chave do Pesquisador:Algoritmo online | Aprendizado de Máquinas em Ambiente Dinâmico | Clustering Data Stream | Extração de Tópicos | Mineração de Dados Textuais | Inteligência Computacional

Resumo

Uma grande quantidade de pesquisa é dedicada a mineração de dados dinâmicos (Data Streams) que, em geral, contém grandes volumes de informação contínua, são multi-dimensionais e de alta velocidade. Tais dados são comuns em aplicações diárias, tais como chamadas telefônicas, vendas no varejo, desempenho de data center, operações de produção, entre outras. Uma instância específica desse problema é a exploração e mineração de coleções em fluxo contínuo de dados textuais. Tal área, na qual analistas estão interessados na percepção do comportamento e tendências desses dados, além de relevante, ainda impõe inúmeros desafios a pesquisadores. Nesse contexto, este projeto tem o objetivo de investigar técnicas inovadoras em mineração de textos para extração de tópicos em fluxo de dados. Os dados considerados são grandes coleções de textos, tipicamente notícias, conteúdo de web-logs etc. As publicações desses dados acontecem em tempo real, o que resulta em constantes alterações na distribuição dos tópicos. Assim, o escopo desta proposta compreende todas as etapas de mineração de textos relacionadas com a extração de tópicos em fluxo de dados. Para isso, serão exploradas e desenvolvidas tecnologias em mineração de textos para a extração e identificação das alterações de tópicos altamente dinâmicos, extração de informação ao longo do tempo e categorização dos textos em relação a sua cobertura temporal. Os resultados desse projeto de doutorado serão validados por meio de corpus e técnicas disponíveis na comunidade de mineração de texto e Data Streaming.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
BERTON, LILIAN; FALEIROS, THIAGO DE PAULO; VALEJO, ALAN; VALVERDE-REBAZA, JORGE; LOPES, ALNEU DE ANDRADE. RGCLI: Robust Graph that Considers Labeled Instances for Semi Supervised Learning. Neurocomputing, v. 226, p. 238-248, . (11/23689-9, 11/21880-3, 15/14228-9, 13/12191-5)
ROSSI, RAFAEL GERALDELI; LOPES, ALNEU DE ANDRADE; FALEIROS, THIAGO DE PAULO; REZENDE, SOLANGE OLIVEIRA. Inductive Model Generation for Text Classification Using a Bipartite Heterogeneous Network. JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, v. 29, n. 3, p. 361-375, . (11/12823-6, 11/23689-9, 11/19850-9)
FALEIROS, THIAGO DE PAULO; VALEJO, ALAN; LOPES, ALNEU DE ANDRADE. Unsupervised learning of textual pattern based on Propagation in Bipartite Graph. Intelligent Data Analysis, v. 24, n. 3, p. 543-565, . (11/23689-9, 15/14228-9)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
FALEIROS, Thiago de Paulo. Propagação em grafos bipartidos para extração de tópicos em fluxo de documentos textuais. 2016. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB) São Carlos.

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.