Pioneiros do aprendizado por reforço ganham ‘Nobel da computação’

05/03/25 • 17:18

Nos anos de 1980, Andrew Barto e Rich Sutton buscaram fazer com que as máquinas aprendessem, assim como humanos e animais, com a experiência. Décadas depois, com a técnica que desenvolveram se tornando cada vez mais importante para a inteligência artificial, no uso de chatbots como o ChatGPT, os pesquisadores receberam, nesta quarta-feira, o Prêmio Turing, considerado o Nobel da computação. A técnica de aprendizagem por reforço envolve persuadir um computador a executar tarefas por meio de experimentação combinada com feedback positivo ou negativo. Em 2016, o Google fez seu uso mais famoso, quando o DeepMind utilizou o recurso para construir o AlphaGo, um programa que aprendeu sozinho como jogar o incrivelmente complexo e sutil jogo de tabuleiro Go para um nível de especialista. Com o sucesso, também passou a ser usada em publicidade, otimização do uso de energia em data centers, finanças e design de chips. (Wired)

Meio

Pioneiros do aprendizado por reforço ganham ‘Nobel da computação’

Você viu?

Contra inflação e impopularidade, governo mexe em impostos de alimentos

'Ainda Estou Aqui' e as direitas em cena no Brasil de hoje

Canal Meio lança primeiro documentário original “Democracia: uma história sem fim”

Veja mais

Nova versão da Alexa incorpora inteligência artificial dentro de seu sistema

Entenda a disputa entre o Rumble e Alexandre de Moraes nos EUA

Hardware com IA pode substituir um celular? Entenda o fracasso do Humane Ai Pin