Créditos: Divulgação: Nvidia

Nvidia apresenta voz artificial que soa como a natural

A voz controlada por AI trará ritmo e entonação
Por Diego Kerber 31/08/2021 12:46 | atualizado 31/08/2021 13:40 Comentários Reportar erro

A Nvidia mostrou sua solução para a voz entediante do seu GPS: a síntese de voz expressiva é um elemento do trabalho da área de pesquisa da NVIDIA em IA conversacional, e tenta trazer uma expressividade mais natural para falas geradas por computador.

As pessoas falam com um ritmo, entonação e timbre complexos que são desafiadores para a IA produzir. Para oferecer suporte aos desenvolvedores e criadores, os pesquisadores da divisão NVIDIA Enterprise estão construindo modelos e ferramentas para síntese de voz controlável de alta qualidade que captura a riqueza da fala humana, sem artefatos de áudio.

Essa solução viabiliza o uso desses modelos de voz automatizadas em serviços como atendimento automatizado de bancos e lojas, ou trazendo personagens de games e livros a vida. Abaixo temos uma amostra do processo de criação da voz e o resultado:

Além da síntese de voz expressiva, o grupo de pesquisa da Nvidia também lida com outros elementos da conversa por Inteligência Artificial (AI), como processamento de linguagem natural, reconhecimento de fala automatizado, detecção de palavras-chave, melhoria de áudio, entre outros. Como não poderia deixar de ser, as soluções desenvolvidas pelo grupo de trabalho são aceleradas por hardware Nvidia, e seu código aberto pode ser acessado no NVIDIA NeMo toolkit, com recursos disponíveis no Nvidia NGC HUB.

A voz expressiva também faz parte de um conjunto de tecnologias em desenvolvimento e exibidas na série "I am AI", que em tradução livre ficaria "Eu sou a Inteligência Artificial". Outra demonstração bastante impressionante foi feita na SIGGRAPH, onde um avatar é criado em tempo-real, usando apenas uma foto como referência e usando a fala e movimento da pessoa para animar o modelo.

- Continua após a publicidade -

A Interspeech 2021 é um evento focado nas últimas pesquisas e tecnologias da área de processamento de fala. Além do sintetizador de voz expressiva, a Nvidia irá divulgar suas participações no evento através desse link. Você pode se informar mais sobre a Interspeech 2021 no site oficial do evento.

.....

Está pensando em comprar algum produto online? Conheça a extensão Economize do Adrenaline para Google Chrome. Ela é gratuita e oferece a você comparativo de preços nas principais lojas e cupons para você comprar sempre com o melhor preço. Baixe agora.

Fonte: Nvidia
  • Redator: Diego Kerber

    Diego Kerber

    Formado em Jornalismo pela Universidade Federal de Santa Catarina (UFSC), Diego Kerber é aficionado por tecnologia desde os oito anos, quando ganhou seu primeiro computador, um 486 DX2. Fã de jogos, especialmente os de estratégia, Diego atua no Adrenaline desde 2010 desenvolvendo artigos e vídeo para o site e canal do YouTube

O que você achou deste conteúdo? Deixe seu comentário abaixo e interaja com nossa equipe. Caso queira sugerir alguma pauta, entre em contato através deste formulário.