Real-Time Open-Domain Question Answering with Dense-Sparse Phrase Index

Da Wiki AI.
Real-Time Open-Domain Question Answering with Dense-Sparse Phrase Index
Data 2021
Autori Minjoon Seo, Jinhyuk Lee, T. Kwiatkowski, Ankur P. Parikh, Ali Farhadi, Hannaneh Hajishirzi
URL https://www.semanticscholar.org/paper/b29db655a18e7417e1188ba392a06b6314f0cb87
Topic Question Answering
Citazioni 148


Questo articolo presenta DenSPI, un modello di retrieval per il Question Answering in tempo reale a dominio aperto.

DenSPI utilizza rappresentazioni indicizzabili delle frasi del documento, indipendenti dalla query, che velocizzano notevolmente il processo di risposta.

La codifica "dense-sparse" delle frasi cattura efficacemente le informazioni sintattiche, semantiche e lessicali, eliminando la necessità di filtrare i documenti di contesto.

Grazie a strategie di ottimizzazione per l'addestramento e l'inferenza, il modello può essere addestrato e distribuito anche su un singolo server con 4 GPU. Inoltre, DenSPI indicizza le frasi dell'intera Wikipedia inglese (fino a 60 miliardi di frasi) utilizzando meno di 2TB di spazio.

Gli esperimenti su SQuAD-Open dimostrano che DenSPI raggiunge prestazioni pari o superiori ai modelli precedenti con un costo computazionale ridotto di 6000 volte, traducendosi in un'inferenza end-to-end almeno 68 volte più veloce sulle CPU.