Deep Reinforcement Learning from Human Preferences: differenze tra le versioni

Da Wiki AI.
 
Nessun oggetto della modifica
Riga 8: Riga 8:


Topic: [[Topic::Metodo alternativo che utilizza le preferenze umane come guida per l'apprendimento]]
Topic: [[Topic::Metodo alternativo che utilizza le preferenze umane come guida per l'apprendimento]]
[[Category:pubblicazione]]


__SHOWFACTBOX__
__SHOWFACTBOX__

Versione delle 10:49, 9 apr 2024