OpenAI o1

Da Wiki AI.

Modello linguistico di grandi dimensioni introdotto da OpenAI il 12 settembre 2024, particolarmente rilevante in quanto utilizza reinforcement learning per fare dei ragionamenti complessi. o1 pensa prima di parlare, producendo una Chain of Thought interna prima di rispondere all'utente. Da notare che le parti di pensiero non vengono mostrate all'utente, ma solo la risposta finale.


Collegamenti

https://openai.com/index/learning-to-reason-with-llms/