Reasoning and Acting (prompting): differenze tra le versioni
(Creata pagina con "Categoria:Tecnica") |
Nessun oggetto della modifica |
||
Riga 1: | Riga 1: | ||
[[Categoria:Tecnica]] | [[Categoria:Tecnica]] | ||
La tecnica di '''ReAct Prompting''', simile a quella del [[Self-Ask (prompting)]] viene usata per indurre un [[modello linguistico di grandi dimensioni]] a rispondere correttamente a domande più o meno complesse che implicano vari passaggi logici e di [[RAG|retrieval]] . | |||
In particolare questa tecnica implica un ciclo in cui il modello alterna ciclicamente fra due fasi: | |||
# '''Fase di ragionamento''' ('''reasoning'''): il modello genera delle tracce di ragionamento, ovvero delle descrizioni dettagliate del suo processo di pensiero rispetto al problema corrnte | |||
# '''Fase di azione''' ('''acting'''): basandosi sugli output della fase di ragionamento il modello esegue azioni specifiche, come il recuper di dati da fonti esterne o l'esecuzione di calcoli con un linguaggio di programmazione, spesso implementata con [[function Calling]] | |||
Questa tecnica rende l'LLM più abile nel rispondere soprattutto alle questioni di confonto, e quelle ''multi-hop'', che si trovano per esempio nel benchmark [[HotpotQA]]. | |||
=== Paper === | |||
[https://arxiv.org/abs/2210.03629 ReAct: Synergizing Reasoning and Acting in Language Models] |
Versione delle 19:48, 14 lug 2024
La tecnica di ReAct Prompting, simile a quella del Self-Ask (prompting) viene usata per indurre un modello linguistico di grandi dimensioni a rispondere correttamente a domande più o meno complesse che implicano vari passaggi logici e di retrieval .
In particolare questa tecnica implica un ciclo in cui il modello alterna ciclicamente fra due fasi:
- Fase di ragionamento (reasoning): il modello genera delle tracce di ragionamento, ovvero delle descrizioni dettagliate del suo processo di pensiero rispetto al problema corrnte
- Fase di azione (acting): basandosi sugli output della fase di ragionamento il modello esegue azioni specifiche, come il recuper di dati da fonti esterne o l'esecuzione di calcoli con un linguaggio di programmazione, spesso implementata con function Calling
Questa tecnica rende l'LLM più abile nel rispondere soprattutto alle questioni di confonto, e quelle multi-hop, che si trovano per esempio nel benchmark HotpotQA.