OpenAI o1: differenze tra le versioni

Versione attuale delle 15:27, 3 feb 2025

Modello linguistico di grandi dimensioni introdotto da OpenAI il 12 settembre 2024, particolarmente rilevante in quanto utilizza reinforcement learning per fare dei ragionamenti complessi. o1 pensa prima di parlare, producendo una Chain of Thought interna prima di rispondere all'utente. Da notare che le parti di pensiero non vengono mostrate all'utente, ma solo la risposta finale.

Collegamenti

https://openai.com/index/learning-to-reason-with-llms/

@@ Riga 1: / Riga 1: @@
-[[Modello linguistico di grandi dimensioni]] introdotto da [[OpenAI]] il 12 settembre 2024, particolarmente rilevante in quanto utilizza [[Apprendimento Per Rinforzo|reinforcement learning]] per fare dei ragionamenti complessi. o1 pensa prima di parlare e produce una [[Chain of Thought]] interna prima di rispondere all'utente. Da notare che le parti di pensiero '''non vengono''' mostrate all'utente, ma solo la risposta finale.
+[[Modello linguistico di grandi dimensioni]] introdotto da [[OpenAI]] il 12 settembre 2024, particolarmente rilevante in quanto utilizza [[Apprendimento Per Rinforzo|reinforcement learning]] per fare dei ragionamenti complessi. o1 pensa prima di parlare, producendo una [[Chain of Thought]] interna prima di rispondere all'utente. Da notare che le parti di pensiero '''non vengono''' mostrate all'utente, ma solo la risposta finale.
 == Collegamenti ==
 https://openai.com/index/learning-to-reason-with-llms/
+[[Categoria:Modello]]