OpenAI o1: differenze tra le versioni

Da Wiki AI.
(Creata pagina con "Modello linguistico di grandi dimensioni introdotto da OpenAI il 12 settembre 2024, particolarmente rilevante in quanto utilizza reinforcement learning per fare dei ragionamenti complessi. o1 pensa prima di parlare e produce una Chain of Thought interna prima di rispondere all'utente. Da notare che le parti di pensiero '''non vengono''' mostrate all'utente, ma solo la risposta finale. == Collegamenti == https://openai.com/inde...")
 
Nessun oggetto della modifica
Riga 4: Riga 4:
== Collegamenti ==
== Collegamenti ==
https://openai.com/index/learning-to-reason-with-llms/
https://openai.com/index/learning-to-reason-with-llms/
[[Categoria:Modello]]

Versione delle 21:27, 2 feb 2025

Modello linguistico di grandi dimensioni introdotto da OpenAI il 12 settembre 2024, particolarmente rilevante in quanto utilizza reinforcement learning per fare dei ragionamenti complessi. o1 pensa prima di parlare e produce una Chain of Thought interna prima di rispondere all'utente. Da notare che le parti di pensiero non vengono mostrate all'utente, ma solo la risposta finale.


Collegamenti

https://openai.com/index/learning-to-reason-with-llms/