国产 GPU 助力，摩尔线程实现对 DeepSeek 蒸馏模型

2025-02-04 12:38:11

　　DeepSeek 开源模型在多语言理解与复杂推理任务中展现了卓越性能。摩尔线程智能科技有限责任公司今日发文宣布，从摩尔线程官方获悉，通过 DeepSeek 提供的蒸馏模型，能够将大规模模型的能力迁移至

　　开源框架适配：基于 Ollama 开源框架，摩尔线程完成 DeepSeek-R1-Distill-Qwen-7B 蒸馏模型的部署，并在多种中文任务中展现了优异的性能，验证摩尔线程自研全功能 GPU 的通用性与 CUDA 兼容性。自研引擎加速：通过摩尔线程自主研发的高性能推理引擎，结合软硬件协同优化技术，通过定制化的算子加速和内存管理，显著提升了模型的计算效率和资源利用率。这一引擎不仅支持 DeepSeek 蒸馏模型的高效运行，还为未来更多大规模模型的部署提供了技术保障。

　　另外，用户也可以基于 MTT S80 和 MTT S4000 进行 DeepSeek-R1 蒸馏模型的