Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models
Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models | |
---|---|
Data | 2024 |
Autori | Yijia Shao, Yucheng Jiang, Theodore A. Kanell, Peter Xu, Omar Khattab, Monica S. Lam |
URL | https://www.semanticscholar.org/paper/2fcad63cc68ca74acdfafdbc145325ee59952f24 |
Topic | Large Language Models |
Citazioni | 13 |
Questo studio esplora l'applicazione di modelli linguistici di grandi dimensioni per la scrittura di articoli lunghi e strutturati a partire da zero, con ampiezza e profondità paragonabili alle pagine di Wikipedia.
Viene proposto STORM, un sistema di scrittura per la sintesi di outline di argomenti attraverso il recupero e la formulazione di domande multi-prospettiva. STORM modella la fase di pre-scrittura (1) scoprendo diverse prospettive nella ricerca dell'argomento dato, (2) simulando conversazioni in cui scrittori con diverse prospettive pongono domande a un esperto in materia basandosi su fonti Internet affidabili, (3) curando le informazioni raccolte per creare una struttura.
Per la valutazione, è stato creato FreshWiki, un set di dati di articoli Wikipedia recenti di alta qualità, e sono state formulate valutazioni di outline per valutare la fase di pre-scrittura. Sono stati inoltre raccolti feedback da redattori Wikipedia esperti. Rispetto agli articoli generati da una baseline di recupero aumentata guidata da outline, più articoli di STORM sono considerati organizzati (con un aumento assoluto del 25%) e ampi nella copertura (del 10%). Il feedback degli esperti aiuta anche a identificare nuove sfide per la generazione di articoli lunghi e fondati, come il trasferimento del bias della fonte e la sovra-associazione di fatti non correlati.
Collegamenti
https://github.com/stanford-oval/storm
https://github.com/assafelovic/gpt-researcher