Pioneiros do aprendizado por reforço ganham ‘Nobel da computação’
Nos anos de 1980, Andrew Barto e Rich Sutton buscaram fazer com que as máquinas aprendessem, assim como humanos e animais, com a experiência. Décadas depois, com a técnica que desenvolveram se tornando cada vez mais importante para a inteligência artificial, no uso de chatbots como o ChatGPT, os pesquisadores receberam, nesta quarta-feira, o Prêmio Turing, considerado o Nobel da computação. A técnica de aprendizagem por reforço envolve persuadir um computador a executar tarefas por meio de experimentação combinada com feedback positivo ou negativo. Em 2016, o Google fez seu uso mais famoso, quando o DeepMind utilizou o recurso para construir o AlphaGo, um programa que aprendeu sozinho como jogar o incrivelmente complexo e sutil jogo de tabuleiro Go para um nível de especialista. Com o sucesso, também passou a ser usada em publicidade, otimização do uso de energia em data centers, finanças e design de chips. (Wired)