Informazioni per "Apprendimento per rinforzo da feedback umano"
Informazioni di base
Titolo visualizzato | Apprendimento per rinforzo da feedback umano |
Criterio di ordinamento predefinito | Apprendimento per rinforzo da feedback umano |
Lunghezza della pagina (in byte) | 4 304 |
ID namespace | 0 |
ID della pagina | 88 |
Lingua del contenuto della pagina | it - italiano |
Modello del contenuto della pagina | wikitesto |
Indicizzazione per i robot | Consentito |
Numero di redirect a questa pagina | 1 |
Conteggiata come una pagina di contenuto | Sì |
Protezione della pagina
Modifica | Autorizza tutti gli utenti (infinito) |
Spostamento | Autorizza tutti gli utenti (infinito) |
Cronologia delle modifiche
Creatore della pagina | Alesaccoia (discussione | contributi) |
Data di creazione della pagina | 14:25, 4 mar 2024 |
Ultimo contributore | Alesaccoia (discussione | contributi) |
Data di ultima modifica | 14:03, 7 feb 2025 |
Numero totale di modifiche | 25 |
Numero totale di autori diversi | 4 |
Numero di modifiche recenti (negli ultimi 90 giorni) | 1 |
Numero di autori diversi recenti | 1 |
Proprietà della pagina
Template incluso (1) | Template utilizzato in questa pagina: |
SEO properties
Descrizione | Contenuto |
Titolo della pagina: (title )This attribute controls the content of the <title> element. | Reinforcement Learning From Human Feedback (RLHF) |
Title mode (title_mode )Ulteriori informazioni | append |
Article description: (description )This attribute controls the content of the description and og:description elements. | RLHF, o Reinforcement Learning from Human Feedback, è una tecnica per addestrare modelli di linguaggio come Llama a generare output in linea con le preferenze umane. Questo processo prevede la creazione di un dataset di preferenze, l'addestramento di un modello di ricompensa e l'ottimizzazione del modello linguistico tramite RL. |
Article image: (image )This attribute controls the content of the og:image element. This image is mostly displayed as a thumbnail on social media. | ![]() |
Parole chiave: (keywords )This attribute controls the content of the keywords and article:tag elements. |
|