[RFC]: TurboQuant — Sub-4-bit KV Cache Quantization for Long-Context Omni Models

March 26, 2026 · #2215

Python Difficulty: Easy

Labels

enhancement

Parent Repository

vllm-project/vllm-omni

Python repository

All Issues Back to vllm-omni

Sign in required

Authenticate to use favourites & bookmarks

5