LLMLingua: Compressing Prompts for Accelerated Inference of Large Language Models

Da Wiki AI.
Versione del 22 ago 2024 alle 09:44 di Alesaccoia (discussione | contributi) (Creata pagina con "LLMLingua: Compressing Prompts for Accelerated Inference of Large Language Models")
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)

LLMLingua: Compressing Prompts for Accelerated Inference of Large Language Models