Busca avançada
Ano de início
Entree

Avaliação de qualidade de voz utilizando aprendizado de máquina e considerando redes wireless

Processo: 20/13459-5
Linha de fomento:Bolsas no Brasil - Programa Capacitação - Treinamento Técnico
Vigência (Início): 01 de novembro de 2020
Vigência (Término): 30 de setembro de 2022
Área do conhecimento:Engenharias - Engenharia Elétrica - Telecomunicações
Pesquisador responsável:Miguel Arjona Ramírez
Beneficiário:Douglas Henrique Silva
Instituição-sede: Escola Politécnica (EP). Universidade de São Paulo (USP). São Paulo , SP, Brasil
Vinculado ao auxílio:18/26455-8 - Processamento Audiovisual de Voz por Aprendizagem de Máquina, AP.R
Assunto(s):Aprendizado computacional   Processamento de sinais   Processamento de voz   Síntese de voz   Reconhecimento de voz   Wireless

Resumo

Existem diferentes metodologias para avaliar a qualidade de voz, as quais se podem de forma geral se podem dividir em métodos subjetivos e objetivos. Estes últimos podem ser divididos em métodos baseados no sinal de fala, métodos paramétricos e híbridos, sendo que os métodos que utilizam o sinal de voz se classificam em intrusivos e não-intrusivos. O presente plano de pesquisa focará nos métodos objetivos não-intrusivos e paramétricos. Para os métodos não intrusivos se aplicará técnicas de aprendizado de máquina para analisar o sinal de voz e suas principais características, incluindo informações do espectrograma desse sinal. Deve-se destacar que a atual métrica não intrusiva padronizada (ITU-T Rec. P.563) não tem um bom desempenho. No respeito do método paramétrico, se propõe implementar diferente cenários de redes em simulador, como por exemplo, redes IEEE 802.11ac, LTE, para poder obter arquivos degradados que considerem degradações características dessas redes e com diferentes tipos de degradações no canal de radiofrequência. Assim, será possível relacionar parâmetros de redes wireless com a qualidade de voz, em base por exemplo, a ITU-T Rec. G.107. Destacando-se também que nos cenários de simulações se utilizará de codificadores de voz padronizados como o AMR, AMR-WB e EVS.

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Matéria(s) publicada(s) em Outras Mídias (0 total):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)