2024-02-03 - EMSI

DEJAVU: 6x faster transformers’ inference

In the YouTube video “Sparse LLMs at inference: 6x faster transformers! | DEJAVU paper explained,” the…