Vai al contenuto

Toggle the table of contents

O1

Da Wiki AI.

Modello linguistico di grandi dimensioni introdotto da OpenAI a fine 2024.

Utiliza il Reinforcement Learning nella fase di training, e Chain of Thought durante l'inferenza, ponendosi all'apice di numerosi benchmark.

Collegamenti

Official System Card

https://openai.com/index/learning-to-reason-with-llms/

https://arxiv.org/pdf/2412.14135

Estratto da "https://wiki.mindmaker.it/index.php?title=O1&oldid=4708"

Modello