Real-Time Open-Domain Question Answering with Dense-Sparse Phrase Index
Real-Time Open-Domain Question Answering with Dense-Sparse Phrase Index | |
---|---|
Data | 2021 |
Autori | Minjoon Seo, Jinhyuk Lee, T. Kwiatkowski, Ankur P. Parikh, Ali Farhadi, Hannaneh Hajishirzi |
URL | https://www.semanticscholar.org/paper/b29db655a18e7417e1188ba392a06b6314f0cb87 |
Topic | Question Answering |
Citazioni | 148 |
Questo articolo presenta DenSPI, un modello di retrieval per il Question Answering in tempo reale a dominio aperto.
DenSPI utilizza rappresentazioni indicizzabili delle frasi del documento, indipendenti dalla query, che velocizzano notevolmente il processo di risposta.
La codifica "dense-sparse" delle frasi cattura efficacemente le informazioni sintattiche, semantiche e lessicali, eliminando la necessità di filtrare i documenti di contesto.
Grazie a strategie di ottimizzazione per l'addestramento e l'inferenza, il modello può essere addestrato e distribuito anche su un singolo server con 4 GPU. Inoltre, DenSPI indicizza le frasi dell'intera Wikipedia inglese (fino a 60 miliardi di frasi) utilizzando meno di 2TB di spazio.
Gli esperimenti su SQuAD-Open dimostrano che DenSPI raggiunge prestazioni pari o superiori ai modelli precedenti con un costo computazionale ridotto di 6000 volte, traducendosi in un'inferenza end-to-end almeno 68 volte più veloce sulle CPU.