Tecnologia
A Meta, anteriormente conhecida como Facebook, anunciou um grande avanço na Inteligência Artificial (IA) generativa para fala, o Voicebox.
Este modelo de IA de ponta é capaz de executar tarefas de geração de fala, como edição, amostragem e estilização.
O Voicebox é capaz de produzir clipes de áudio, editar áudio pré-gravado e remover ruídos indesejados, como buzinas de carros ou latidos de cães.
Além disso, o modelo é multilíngue, podendo produzir fala em seis idiomas diferentes. A IA pode traduzir conteúdos para o português, polonês, inglês, alemão, francês e espanhol.
No futuro, modelos de IA generativa como o Voicebox poderão fornecer vozes com som natural a assistentes virtuais e NPCs no metaverso.
Além disso, permitirão que pessoas com deficiência visual ouçam mensagens escritas por amigos, lidas em suas vozes originais.
Outras funcionalidades incluem oferecer aos criadores novas ferramentas para criar e editar facilmente conteúdos de áudio para vídeos, entre outras.
O Voicebox é capaz de realizar uma variedade de tarefas, incluindo síntese de texto para fala em contexto, edição de fala e redução de ruído, transferência de estilo entre idiomas e amostragem de fala diversificada.
Este avanço representa um importante passo na pesquisa de IA generativa da Meta, que espera continuar seus estudos no espaço de áudio e ver como outros pesquisadores se baseiam em seu trabalho.