DeepMind do Google cria ferramenta de IA para gerar áudios em vídeos

Receba notícias todo dia no seu e-mail.

Assine agora. É grátis.

A DeepMind, empresa de pesquisa e desenvolvimento de IA do Google, está desenvolvendo uma nova tecnologia para gerar trilhas sonoras em vídeos. Chamada de V2A (abreviação de “vídeo para áudio”, em inglês), o recurso utiliza a descrição de uma trilha sonora para criar música, efeitos sonoros e até diálogos que correspondam aos personagens e ao tom das imagens. O modelo de IA que alimenta o V2A foi treinado combinando sons, transcrições de diálogos e videoclipes. “Através do treinamento em vídeo, áudio e anotações adicionais, nossa tecnologia aprende a associar eventos de áudio específicos a várias cenas visuais, ao mesmo tempo que responde às informações fornecidas nas anotações ou transcrições”, diz a companhia. A ferramenta seria capaz de compreender os pixels brutos de uma imagem e sincronizar automaticamente os sons gerados, sem necessidade de descrições. Por ainda não ter alcançado uma qualidade alta de som e para evitar o uso indevido, como deep fakes focadas em desinformação, a DeepMind disse que não disponibilizará o recurso tão cedo. (TechCrunch)

PUBLICIDADE

Encontrou algum problema no site? Entre em contato.