面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型

2024-09-06 09:29:39

  面壁智能官方昨日发布博文,附上 MiniCPM 3.0开源地址:

  MiniCPM3-4B 是 MiniCPM 系列的第三代产品,整体性能超过了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,媲美多款 70 亿~90 亿参数的 AI 模型。

  相比 MiniCPM1.0 / MiniCPM2.0,MiniCPM3-4B 拥有更强大、更多用途的技能集,可用于更广泛的用途。MiniCPM3-4B 支持函数调用和代码解释器。

  下面是 3 个版本的模型结构的区别:

  MiniCPM3-4B 有一个 32k 上下文窗口。MiniCPM3-4B 借助 LLMxMapReduce,不需要占用太高的内存,可以处理理论上的无限上下文。

  面壁智能还发布了 RAG 套件 MiniCPM-Embedding 模型和 MiniCPM-Reranker 模型,针对 RAG 场景还发布了微调版 MiniCPM3-RAG-LoRA 模型。

下一篇:爱普生推出其首款 UV 桌面打印机 SureColor V1070,售
上一篇:夏普推 XP-X141Q RB 激光投影机:13500 流明、920 万像
返回顶部小火箭