Vai al contenuto

Dataset di Preferenze

Da Wiki AI.

Versione del 11 apr 2024 alle 10:30 di Sara Maserati (discussione | contributi)

(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)

Nome: Dataset di Preferenze

Nome inglese: Preferences Dataset

Dataset utilizzato per il tuning del Modello di Reward nel contesto del Reinforcement Learning From Human Feedback (RLHF). Per i migliori risultati servono almeno 500 campioni.

Estratto da "https://wiki.mindmaker.it/index.php?title=Dataset_di_Preferenze&oldid=2104"

Concetto

Dati

... altro su "Dataset di Preferenze"

Dataset di Preferenze +

Preferences Dataset +