Reasoning and Acting (prompting): differenze tra le versioni

Versione delle 19:48, 14 lug 2024

La tecnica di ReAct Prompting, simile a quella del Self-Ask (prompting) viene usata per indurre un modello linguistico di grandi dimensioni a rispondere correttamente a domande più o meno complesse che implicano vari passaggi logici e di retrieval .

In particolare questa tecnica implica un ciclo in cui il modello alterna ciclicamente fra due fasi:

Fase di ragionamento (reasoning): il modello genera delle tracce di ragionamento, ovvero delle descrizioni dettagliate del suo processo di pensiero rispetto al problema corrnte
Fase di azione (acting): basandosi sugli output della fase di ragionamento il modello esegue azioni specifiche, come il recuper di dati da fonti esterne o l'esecuzione di calcoli con un linguaggio di programmazione, spesso implementata con function Calling

Questa tecnica rende l'LLM più abile nel rispondere soprattutto alle questioni di confonto, e quelle multi-hop, che si trovano per esempio nel benchmark HotpotQA.

Paper

ReAct: Synergizing Reasoning and Acting in Language Models

@@ Riga 1: / Riga 1: @@
 [[Categoria:Tecnica]]
+La tecnica di '''ReAct Prompting''', simile a quella del [[Self-Ask (prompting)]] viene usata per indurre un [[modello linguistico di grandi dimensioni]] a rispondere correttamente a domande più o meno complesse che implicano vari passaggi logici e di [[RAG|retrieval]] .
+In particolare questa tecnica implica un ciclo in cui il modello alterna ciclicamente fra due fasi:
+# '''Fase di ragionamento''' ('''reasoning'''): il modello genera delle tracce di ragionamento, ovvero delle descrizioni dettagliate del suo processo di pensiero rispetto al problema corrnte
+# '''Fase di azione''' ('''acting'''): basandosi sugli output della fase di ragionamento il modello esegue azioni specifiche, come il recuper di dati da fonti esterne o l'esecuzione di calcoli con un linguaggio di programmazione, spesso implementata con [[function Calling]]
+Questa tecnica rende l'LLM più abile nel rispondere soprattutto alle questioni di confonto, e quelle ''multi-hop'', che si trovano per esempio nel benchmark [[HotpotQA]].
+=== Paper ===
+[https://arxiv.org/abs/2210.03629 ReAct: Synergizing Reasoning and Acting in Language Models]