Busca avançada
Ano de início
Entree

Aprendendo com a web a traduzir e parafrasear textos

Resumo

O reconhecimento automático de paráfrases e a tradução automática são duas subáreas doProcessamento de Língua Natural (PLN) que compartilham semelhanças, como o fato de ambaslidarem com textos paralelos (textos que expressam o mesmo conteúdo) sejam eles monolíngues(no caso das paráfrases) ou bilíngues (no caso das traduções). Contudo, apenas recentemente alguns poucos estudos foram desenvolvidos explorando a combinação de métodos e técnicas dessas duas subáreas de PLN (BANNARD; CALLISON-BURCH, 2005; CALLISON-BURCH et al., 2006;BARREIRO, 2008; PANG et al., 2003). Neste projeto, visa-se investigar a extração automática de paráfrases e de conhecimento útil para a tradução automática usando a estratégia de aprendizado de máquina sem-fim (AMSF) e a web como fonte de conhecimento. Repositórios onlines de conhecimento como a Wikipédia, por exemplo, definem, explicam e exemplificam conhecimento demaneiras distintas. Repositórios onlines de legendas como OpenSubtitles e SubDB e letras demúsicas como o Lyrics apresentam versões de um mesmo texto em vários idiomas. Esses repositórios são valiosas fontes de informação para os métodos de extração automática de paráfrases e de conhecimento útil para a tradução que serão projetados seguindo a estratégia de AMSF. O AMSF é uma estratégia de aprendizado de máquina recente baseada no aprendizado constante e incremental inspirada no modo como nós, humanos, aprendemos. A ideia do AMSF é que ao aprendermos conceitos simples e relações simples entre esses conceitos nós nos tornamos capazes de aprender, no futuro, algo novo e mais complexo (MITCHELL et al., 2008). Essa proposta é inovadora na aplicação de AMSF nas duas subáreas de PLN citadas e poderá dar origem a abordagens integradas contribuindo, assim, com o avanço nessas e outras áreas de pesquisa. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre o auxílio:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)

Publicações científicas
(Referências obtidas automaticamente do Web of Science e do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores)
DE JESUS MARTINS, DEBORA BEATRIZ; CASELI, HELENA DE MEDEIROS. Automatic machine translation error identification. MACHINE TRANSLATION, v. 29, n. 1, p. 1-24, . (13/50757-0, 13/11811-0, 11/03799-4, 10/07517-0)

Por favor, reporte erros na lista de publicações científicas escrevendo para: cdi@fapesp.br.