A Inteligência Artificial Aprendeu A Reconhecer Corretamente A Fala Entre Ruídos - Visão Alternativa

A Inteligência Artificial Aprendeu A Reconhecer Corretamente A Fala Entre Ruídos - Visão Alternativa
A Inteligência Artificial Aprendeu A Reconhecer Corretamente A Fala Entre Ruídos - Visão Alternativa

Vídeo: A Inteligência Artificial Aprendeu A Reconhecer Corretamente A Fala Entre Ruídos - Visão Alternativa

Vídeo: A Inteligência Artificial Aprendeu A Reconhecer Corretamente A Fala Entre Ruídos - Visão Alternativa
Vídeo: INTELIGÊNCIA ARTIFICIAL aprende a FALAR com MINHA VOZ! 2024, Pode
Anonim

Assistentes virtuais e sistemas de reconhecimento de voz aprenderam a “reconhecer” o que uma pessoa diz a eles e a seguir seus comandos. Mas para o funcionamento correto do mesmo Siri e Cortana, ruídos estranhos podem ser um grande problema. Os especialistas da Mitsubishi Electric podem ajudar a lidar com essa falha técnica, que apresentou uma nova tecnologia para separar a fala de uma pessoa do ruído geral.

A tecnologia da empresa japonesa é chamada de Deep Clustering, cujo funcionamento é baseado nos princípios do aprendizado de máquina. Para começar, a inteligência artificial aprendeu a separar independentemente a fala de uma pessoa do fluxo geral de vários sons e ruídos. A rede neural separa os dados de áudio de entrada em vários elementos e analisa cada um separadamente, após o que já pode processar a voz humana. Trabalho semelhante é observado quando dois ou mais interlocutores estão “conectados”.

Durante uma demonstração da tecnologia de uma empresa japonesa, o sistema conseguiu separar com sucesso a fala de duas pessoas falando a mesma frase em um microfone em diferentes idiomas. Todo o processamento foi realizado em tempo real, e o atraso não ultrapassou três segundos. A precisão do reconhecimento era de 90% e, quando três pessoas começaram a falar no microfone, a porcentagem de "acessos" caiu para 80, o que também é um bom resultado. Segundo os autores do projeto Anthony Vetro e Yohei Okato,

“Ao contrário de separar a fala de ruídos de fundo, separar a fala de uma pessoa do ruído de“voz”de pessoas falando ao mesmo tempo é uma tarefa muito difícil, já que os sons da voz de diferentes pessoas têm muitas peculiaridades. Na maioria dos sistemas, o problema de separação de voz é resolvido com a instalação de dois ou mais microfones, mas no caso de usar apenas um microfone, apenas a inteligência artificial pode lidar com a tarefa de separação de voz. Esta tecnologia pode ser usada sempre que uma alta precisão de reconhecimento de mensagem de voz é necessária. Por exemplo, em sistemas de controle de voz para carros, elevadores, residências e outros dispositivos eletrônicos."

VLADIMIR KUZNETSOV

Recomendado: