Vai al contenuto

Deep Reinforcement Learning from Human Preferences: differenze tra le versioni

Da Wiki AI.

VisualeWikitesto

Versione delle 10:49, 9 apr 2024

Titolo: Deep Reinforcement Learning from Human Preferences

Anno di pubblicazione: 2023

Autori: Paul F Christiano; Jan Leike; Tom B Brown; Miljan Martic; Shane Legg; Dario Amodei

URL: https://arxiv.org/pdf/1706.03741.pdf

Topic: Metodo alternativo che utilizza le preferenze umane come guida per l'apprendimento

Estratto da "https://wiki.mindmaker.it/index.php?title=Deep_Reinforcement_Learning_from_Human_Preferences&oldid=1879"

Pubblicazione

Dati

... altro su "Deep Reinforcement Learning from Human Preferences"

AnnoDiPubblicazione

2023 +

Paul F Christiano +, Jan Leike +, Tom B Brown +, Miljan Martic +, Shane Legg + e Dario Amodei +

Deep Reinforcement Learning from Human Preferences +

Metodo alternativo che utilizza le preferenze umane come guida per l'apprendimento +

URL"URL" è un tipo e una proprietà predefinita fornita da Semantic MediaWiki per rappresentare valori di URI/URL.

https://arxiv.org/pdf/1706.03741.pdf +