Busca avançada
Ano de início
Entree

VERBO-BRASIL: um novo recurso léxico-semântico para o processamento automático do português

Processo: 11/22337-1
Modalidade de apoio:Bolsas no Brasil - Pós-Doutorado
Vigência (Início): 01 de junho de 2012
Vigência (Término): 31 de maio de 2013
Área do conhecimento:Linguística, Letras e Artes - Linguística - Teoria e Análise Lingüística
Pesquisador responsável:Sandra Maria Aluísio
Beneficiário:Magali Sanches Duran
Instituição Sede: Instituto de Ciências Matemáticas e de Computação (ICMC). Universidade de São Paulo (USP). São Carlos , SP, Brasil
Assunto(s):Linguística computacional
Palavra(s)-Chave do Pesquisador:Processamento de Língua Natural (PLN) | Linguística Computacional

Resumo

O presente projeto visa construir um repositório digital de verbos, com seus sentidos e respectivos conjuntos de papéis semânticos previstos. Esse repositório será navegável na web e terá formato adequado para ser usado em aplicações de processamento de línguas naturais. O projeto prevê também o mapeamento para o repositório do projeto SemLink (http://verbs.colorado.edu/semlink/), o que possibilitará herdar os mapeamentos entre os recursos léxico-semânticos do inglês (Wordnet, Verbnet, Framenet e Propbank). O corpus que fornecerá dados para a tarefa é o Propbank-Br (Duran e Aluísio, 2011), que é o resultado da anotação de papéis semânticos na porção brasileira do corpus Bosque (um treebank do português). O editor de arquivos do repositório será o Cornerstone (Choi et al. 2010). A criação desse repositório de verbos é fundamental para que se possa empreender a anotação de papéis semânticos em larga escala em um corpus do português do Brasil, a fim de disponibilizar um corpus robusto de treinamento para diversas tarefas de processamento de línguas naturais, dentre as quais a extração automática de informações, pergunta e resposta e tradução automática.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)