Reasoning and Acting (prompting): differenze tra le versioni

Da Wiki AI.
(Creata pagina con "Categoria:Tecnica")
 
Nessun oggetto della modifica
Riga 1: Riga 1:
[[Categoria:Tecnica]]
[[Categoria:Tecnica]]
La tecnica di '''ReAct Prompting''', simile a quella del [[Self-Ask (prompting)]] viene usata per indurre un [[modello linguistico di grandi dimensioni]] a rispondere correttamente a domande più o meno complesse che implicano vari passaggi logici e di [[RAG|retrieval]] .
In particolare questa tecnica implica un ciclo in cui il modello alterna ciclicamente fra due fasi:
# '''Fase di ragionamento''' ('''reasoning'''): il modello genera delle tracce di ragionamento, ovvero delle descrizioni dettagliate del suo processo di pensiero rispetto al problema corrnte
# '''Fase di azione''' ('''acting'''): basandosi sugli output della fase di ragionamento il modello esegue azioni specifiche, come il recuper di dati da fonti esterne o l'esecuzione di calcoli con un linguaggio di programmazione, spesso implementata con [[function Calling]]
Questa tecnica rende l'LLM più abile nel rispondere soprattutto alle questioni di confonto, e quelle ''multi-hop'', che si trovano per esempio nel benchmark [[HotpotQA]].
=== Paper ===
[https://arxiv.org/abs/2210.03629 ReAct: Synergizing Reasoning and Acting in Language Models]

Versione delle 19:48, 14 lug 2024

La tecnica di ReAct Prompting, simile a quella del Self-Ask (prompting) viene usata per indurre un modello linguistico di grandi dimensioni a rispondere correttamente a domande più o meno complesse che implicano vari passaggi logici e di retrieval .

In particolare questa tecnica implica un ciclo in cui il modello alterna ciclicamente fra due fasi:

  1. Fase di ragionamento (reasoning): il modello genera delle tracce di ragionamento, ovvero delle descrizioni dettagliate del suo processo di pensiero rispetto al problema corrnte
  2. Fase di azione (acting): basandosi sugli output della fase di ragionamento il modello esegue azioni specifiche, come il recuper di dati da fonti esterne o l'esecuzione di calcoli con un linguaggio di programmazione, spesso implementata con function Calling

Questa tecnica rende l'LLM più abile nel rispondere soprattutto alle questioni di confonto, e quelle multi-hop, che si trovano per esempio nel benchmark HotpotQA.

Paper

ReAct: Synergizing Reasoning and Acting in Language Models