DeepMind do Google cria ferramenta de IA para gerar áudios em vídeos

17/06/24 • 18:09

A DeepMind, empresa de pesquisa e desenvolvimento de IA do Google, está desenvolvendo uma nova tecnologia para gerar trilhas sonoras em vídeos. Chamada de V2A (abreviação de “vídeo para áudio”, em inglês), o recurso utiliza a descrição de uma trilha sonora para criar música, efeitos sonoros e até diálogos que correspondam aos personagens e ao tom das imagens. O modelo de IA que alimenta o V2A foi treinado combinando sons, transcrições de diálogos e videoclipes. “Através do treinamento em vídeo, áudio e anotações adicionais, nossa tecnologia aprende a associar eventos de áudio específicos a várias cenas visuais, ao mesmo tempo que responde às informações fornecidas nas anotações ou transcrições”, diz a companhia. A ferramenta seria capaz de compreender os pixels brutos de uma imagem e sincronizar automaticamente os sons gerados, sem necessidade de descrições. Por ainda não ter alcançado uma qualidade alta de som e para evitar o uso indevido, como deep fakes focadas em desinformação, a DeepMind disse que não disponibilizará o recurso tão cedo. (TechCrunch)

Meio

DeepMind do Google cria ferramenta de IA para gerar áudios em vídeos

Você viu?

Edição de sábado: Entre a comunhão e o cisma

A batata quente do escândalo no INSS

Legendários é uma seita?

Veja mais

Legendários é uma seita?

Trump: o gerente enlouqueceu

A direita cancela o Ira!