摘要: 在大语言模型基础知识一文中,已简要介绍了模型量化与高效推理部署,二者是实现大语言模型(Large Language Model,LLM)低成本、高效落地的关键路径。本文将系统阐述模型量化的基本原理,并详细介绍LLM高效推理的核心技术与常用框架。 目录1 LLM中的量化技术1.1 量化背景1.2 量化 阅读全文
posted @ 2026-02-11 16:43 落痕的寒假 阅读(508) 评论(0) 推荐(1)