YouTuber processa OpenAI por suposto uso de dados
David Millette, criador de conteúdo do YouTube, está movendo uma ação coletiva contra a OpenAI, alegando que a empresa teria utilizado transcrições de diversos vídeos do YouTube para treinar seus modelos de IA sem notificar ou compensar os proprietários dos vídeos. A queixa, apresentada no Tribunal Distrital dos EUA, alega violação de direitos autorais e dos termos de serviço do YouTube. Millette quer um julgamento com júri e mais de US$ 5 milhões de restituição em danos.
A OpenAI é acusada de lucrar significativamente com dados coletados sem consentimento, a partir de seu modelo Whisper para transcrever vídeos do YouTube, cujas transcrições ajudaram a treinar o GPT-4. Modelos de IA da empresa foram treinados com dados de sites públicos, gerando um debate ético sobre o uso justo de informações. As transcrições de vídeo são cruciais para dados de treinamento, mas muitos sites bloqueiam o rastreador da OpenAI.
Outras empresas, como Apple e Google, também exploram transcrições de vídeos para treinar seus modelos. Recentemente, inclusive, o Google ajustou seus termos de serviço para explorar mais dados de usuários. (TechCrunch)