A Comprehensive Survey — 系統研究論文視覺化導覽涵蓋 2023–2026 年頂會論文,7 大問題領域, 篇論文
LLM 驅動的自主 agent 系統暴露了現有 LLM serving 基礎設施與 agentic 工作負載之間的根本不匹配。本 survey 將 2023–2026 年的系統研究組織為 7 個問題領域,重點深入 KV cache 管理、保留策略和排程。