Reasoning and Acting (prompting): differenze tra le versioni
Nessun oggetto della modifica |
Nessun oggetto della modifica |
||
Riga 8: | Riga 8: | ||
Questa tecnica rende l'LLM più abile nel rispondere soprattutto alle questioni di confonto, e quelle ''multi-hop'', che si trovano per esempio nel benchmark [[HotpotQA]]. | Questa tecnica rende l'LLM più abile nel rispondere soprattutto alle questioni di confonto, e quelle ''multi-hop'', che si trovano per esempio nel benchmark [[HotpotQA]]. | ||
[[File:React.png|nessuno|miniatura|700x700px|https://react-lm.github.io/]] | |||
=== Paper === | === Paper === | ||
[https://arxiv.org/abs/2210.03629 ReAct: Synergizing Reasoning and Acting in Language Models] | [https://arxiv.org/abs/2210.03629 ReAct: Synergizing Reasoning and Acting in Language Models] |
Versione attuale delle 19:50, 14 lug 2024
La tecnica di ReAct Prompting, simile a quella del Self-Ask (prompting) viene usata per indurre un modello linguistico di grandi dimensioni a rispondere correttamente a domande più o meno complesse che implicano vari passaggi logici e di retrieval .
In particolare questa tecnica implica un ciclo in cui il modello alterna ciclicamente fra due fasi:
- Fase di ragionamento (reasoning): il modello genera delle tracce di ragionamento, ovvero delle descrizioni dettagliate del suo processo di pensiero rispetto al problema corrnte
- Fase di azione (acting): basandosi sugli output della fase di ragionamento il modello esegue azioni specifiche, come il recuper di dati da fonti esterne o l'esecuzione di calcoli con un linguaggio di programmazione, spesso implementata con function Calling
Questa tecnica rende l'LLM più abile nel rispondere soprattutto alle questioni di confonto, e quelle multi-hop, che si trovano per esempio nel benchmark HotpotQA.
