会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
gpustack
博客园
首页
新随笔
联系
订阅
管理
2026年4月8日
vLLM 新参数 performance-mode 能带来多大提升?Qwen3.5 实测告诉你答案
摘要: 本文基于 Qwen3.5 在 H100/H200 上的实测,分析 vLLM performance-mode 的实际作用。结果表明,它并非独立提速手段,而是结合量化、cache 等优化,用于收敛低延迟或高吞吐目标,主要价值在于缩小调优范围。
阅读全文
posted @ 2026-04-08 14:15 GPUStack
阅读(120)
评论(0)
推荐(0)
公告