OpenAI o1: differenze tra le versioni
(Creata pagina con "Modello linguistico di grandi dimensioni introdotto da OpenAI il 12 settembre 2024, particolarmente rilevante in quanto utilizza reinforcement learning per fare dei ragionamenti complessi. o1 pensa prima di parlare e produce una Chain of Thought interna prima di rispondere all'utente. Da notare che le parti di pensiero '''non vengono''' mostrate all'utente, ma solo la risposta finale. == Collegamenti == https://openai.com/inde...") |
Nessun oggetto della modifica |
||
(Una versione intermedia di uno stesso utente non è mostrata) | |||
Riga 1: | Riga 1: | ||
[[Modello linguistico di grandi dimensioni]] introdotto da [[OpenAI]] il 12 settembre 2024, particolarmente rilevante in quanto utilizza [[Apprendimento Per Rinforzo|reinforcement learning]] per fare dei ragionamenti complessi. o1 pensa prima di parlare | [[Modello linguistico di grandi dimensioni]] introdotto da [[OpenAI]] il 12 settembre 2024, particolarmente rilevante in quanto utilizza [[Apprendimento Per Rinforzo|reinforcement learning]] per fare dei ragionamenti complessi. o1 pensa prima di parlare, producendo una [[Chain of Thought]] interna prima di rispondere all'utente. Da notare che le parti di pensiero '''non vengono''' mostrate all'utente, ma solo la risposta finale. | ||
== Collegamenti == | == Collegamenti == | ||
https://openai.com/index/learning-to-reason-with-llms/ | https://openai.com/index/learning-to-reason-with-llms/ | ||
[[Categoria:Modello]] |
Versione attuale delle 15:27, 3 feb 2025
Modello linguistico di grandi dimensioni introdotto da OpenAI il 12 settembre 2024, particolarmente rilevante in quanto utilizza reinforcement learning per fare dei ragionamenti complessi. o1 pensa prima di parlare, producendo una Chain of Thought interna prima di rispondere all'utente. Da notare che le parti di pensiero non vengono mostrate all'utente, ma solo la risposta finale.