Deep Reinforcement Learning from Human Preferences
Titolo: Deep Reinforcement Learning from Human Preferences
Anno di pubblicazione: 2023
Autori: Paul F Christiano; Jan Leike; Tom B Brown; Miljan Martic; Shane Legg; Dario Amodei
URL: https://arxiv.org/pdf/1706.03741.pdf
Topic: Metodo alternativo che utilizza le preferenze umane come guida per l'apprendimento