Vai al contenuto

Toggle the table of contents

Speculative Decoding

Da Wiki AI.

Tecnica per ottimizzare il tempo di inferenza dei modelli Transformer.

E' stata proposta nella pubblicazione Fast Inference from Transformers via Speculative Decoding.

Ha in comune concetti con la Distillazione Della Conoscenza.

Collegamenti

https://huggingface.co/blog/whisper-speculative-decoding

Estratto da "https://wiki.mindmaker.it/index.php?title=Speculative_Decoding&oldid=3127"

Tecnica