月之暗面 Kimi 联合清华大学等开源大模型推理架

2024-11-28 13:36:44

  月之暗面 Kimi 和清华大学 MADSys 实验室 2024 年 6 月联合发布了 Kimi 底层的 Mooncake 推理系统设计方案。该系统基于以 KVCache 为中心的 PD 分离和以存换算架构,近日,为了进一步加速该技术框架的应用与推广,月之暗面 Kimi 和清华大学 MADSys 实验室联合 9#AISoft、阿里云、华为存储、面壁智能、趋境科技等11 月 28 日,Mooncake 技术框架已开源上线,附地址如下:

  据介绍,Mooncake 开源项目从论文延伸,以超大规模 KVCache 缓存池为中心,通过以存换算的创新理念大幅度减少算力开销,提升了推理吞吐量。

  Mooncake 开源项目的最终目标是,为大模型时代打造一种新型高性能内存语义存储的标准接口,并提供参考实现方案。

  Mooncake 推理系统架构图

下一篇:三星卷轴平板专利曝光:可根据使用场景,自动
上一篇:思特威推出全流程国产化 50MP 旗舰手机图像传感
返回顶部小火箭