Busca avançada
Ano de início
Entree

Incorporação da semântica na construção de websensors

Processo: 13/14757-6
Modalidade de apoio:Bolsas no Brasil - Doutorado
Vigência (Início): 01 de dezembro de 2013
Vigência (Término): 31 de maio de 2018
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação - Metodologia e Técnicas da Computação
Pesquisador responsável:Solange Oliveira Rezende
Beneficiário:Roberta Akemi Sinoara
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Bolsa(s) vinculada(s):16/07620-2 - Representação Semântica para Classificação de Textos, BE.EP.DR
Assunto(s):Inteligência artificial   Semântica   Agrupamento de dados   Banco de dados textuais   Web semântica   Mineração de texto
Palavra(s)-Chave do Pesquisador:Agrupamento de Textos | Mineração de Textos | Representação de dados textuais | semântica | Websensors | Inteligência Artificial

Resumo

Com o aumento da quantidade e variedade de textos em formato digital, seja em redes sociais, web ou internamente nas organizações, as técnicas de Mineração de Textos tornam-se essenciais no apoio à extração de conhecimento. Pesquisas e aplicações têm sido desenvolvidas visando utilizar a web como um poderoso sensor social. Nesse contexto, surgem os websensors, sensores que monitoram a publicação de textos e mantêm uma série temporal da atividade de determinados tópicos. A aplicabilidade dos websensors é ampla. De acordo com os textos monitorados, a atividade de um websensor pode ajudar a entender, explicar ou predizer determinado fato. Os websensors podem ser construídos a partir do agrupamento de textos, evitando assim a necessidade de um grande volume de dados rotulados ou do intenso esforço de um especialista do domínio para definir os parâmetros dos sensores. No entanto, os aspectos semânticos dos textos podem ser decisivos na qualidade e no uso efetivo do agrupamento obtido. Para o aprendizado de bons websensors pode ser necessária, por exemplo, uma organização dos textos que diferencie documentos que, apesar de utilizarem o mesmo vocabulário, apresentem ideias diferentes sobre um mesmo assunto. Pesquisas em Mineração de Textos têm apresentado diversos avanços nos últimos anos, porém a incorporação da semântica ainda é um desafio a ser superado. Motivado por essa lacuna, este projeto de doutorado visa explorar a incorporação de semântica na construção de websensors, buscando uma organização mais refinada, que considere ideias expressas nos documentos. Visando representar diferentes aspectos semânticos, será desenvolvido um novo formato de representação de dados textuais. Além disso, algoritmos de agrupamento serão desenvolvidos ou adaptados para utilizar essa nova representação de maneira efetiva. Vale ressaltar que, apesar do foco deste trabalho ser a incorporação da semântica no agrupamento de textos para construção de websensors, os resultados obtidos poderão posteriormente ser expandidos para outras tarefas da Mineração de Textos, como a classificação automática de documentos e a análise de sentimentos. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas (4)
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
SINOARA, ROBERTA A.; SCHEICHER, RICARDO B.; REZENDE, SOLANGE O.; IEEE. Evaluation of Latent Dirichlet Allocation for Document Organization in Different Levels of Semantic Complexity. 2017 IEEE SYMPOSIUM SERIES ON COMPUTATIONAL INTELLIGENCE (SSCI), v. N/A, p. 8-pg., . (13/14757-6)
SINOARA, ROBERTA A.; ROSSI, RAFAEL G.; REZENDE, SOLANGE O.; IEEE. Semantic Role-based Representations in Text Classification. 2016 23RD INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR), v. N/A, p. 6-pg., . (16/07620-2, 14/08996-0, 11/12823-6, 13/14757-6)
SINOARA, ROBERTA A.; SUNDERMANN, CAMILA V.; MARCACINI, RICARDO M.; DOMINGUES, MARCOS A.; REZENDE, SOLANGE O.; ALMEIDA, A; BERNARDINO, J; GOMES, EF. Named Entities as Privileged Information for Hierarchical Text Clustering. PROCEEDINGS OF THE 18TH INTERNATIONAL DATABASE ENGINEERING AND APPLICATIONS SYMPOSIUM (IDEAS14), v. N/A, p. 10-pg., . (13/16039-3, 13/14757-6, 10/20564-8, 12/13830-9)
SINOARA, ROBERTA A.; CAMACHO-COLLADOS, JOSE; ROSSI, RAFAEL G.; NAVIGLI, ROBERTO; REZENDE, SOLANGE O.. Knowledge-enhanced document embeddings for text classification. KNOWLEDGE-BASED SYSTEMS, v. 163, p. 955-971, . (16/17078-0, 13/14757-6, 16/07620-2)
Publicações acadêmicas
(Referências obtidas automaticamente das Instituições de Ensino e Pesquisa do Estado de São Paulo)
SINOARA, Roberta Akemi. Aspectos semânticos na representação de textos para classificação automática. 2018. Tese de Doutorado - Universidade de São Paulo (USP). Instituto de Ciências Matemáticas e de Computação (ICMC/SB) São Carlos.

Por favor, reporte erros na lista de publicações científicas utilizando este formulário.