Why think step by step? Reasoning emerges from the locality of experience (2023)

Da Wiki AI.
Why think step by step? Reasoning emerges from the locality of experience (2023)
Data 2 novembre 2023
Autori Ben Prystawski, Michael Y. Li, Noah D. Goodman
URL https://www.semanticscholar.org/paper/9a3edb5c6b0e8c84c94ea99a9ab647b1209f650f
Topic Ragionamento a catena di pensiero nei modelli di linguaggio
Citazioni 45


Questo paper esplora come i modelli di linguaggio, come GPT (Generative Pre-trained Transformer), migliorano le loro capacità di fare inferenze attraverso quello che viene chiamato ragionamento a catena di pensiero. L'idea centrale è che questi modelli possono diventare più efficaci quando "ragionano" attraverso una serie di passaggi intermedi, piuttosto che cercare di saltare direttamente alla conclusione finale.

Il paper tratta il concetto di "Burstiness", che significa che certi argomenti o idee tendono a comparire in gruppi ravvicinati nei dati di addestramento dei modelli. Questo aiuta i modelli a imparare meglio da esempi specifici. La "Località" si riferisce a come certi argomenti o classi tendono a essere presentati insieme. Questi concetti aiutano i modelli di linguaggio a capire e prevedere quali argomenti o parole sono probabilmente collegati o rilevanti l'uno all'altro in un dato contesto, migliorando così la loro capacità di "capire" il testo e fare inferenze basate su di esso.

Link Paper

https://arxiv.org/pdf/2304.03843.pdf