清华系团队 DeepSeek 版多模态生物医药大模型 Bi

2025-02-21 14:02:52

  清华大学人工智能产业研究院和北京水木分子生物科技有限公司昨日宣布推出此前,在 2023 年,双方合作发布了开源可商用、生物医药多模态百亿参数开源基础大模型 BioMedGPT,水木分子发布了自研千亿参数多模态生物医药专业大模型 ChatDDFM 和新一代 AI 驱动药物发现工具 ChatDD。BioMedGPT 是清华大学智能产业研究院携手水木分子开源的全球首个可商用多模态生物医药百亿参数大模型,该模型在生物医药专业领域问答能力号称“在 BioMedGPT 的基础上,清华大学 AIR 与水木分子推出了 BioMedGPT-R1,通过跨模态特征对齐,BioMedGPT-R1 实现了生物模态与自然语言文本模态在同一个特征空间的统一融合,探索了生物多模态场景下的模型深度推理能力。

  通过训练对齐翻译层,BioMedGPT-R1 将生物模态编码器输出映射到自然语言表征空间,从而在 DeepSeek R1 基础上增加了生物模态数据的理解能力。

  BioMedGPT-R1 模型框架和主要训练步骤

  BioMedGPT-R1 的训练分为两个主要步骤:

  首先,仅训练对齐翻译层 Translator,使其能将编码后的生物模态表征映射到语义表征空间;

  然后,同时微调对齐翻译层 Translator 和基座大语言模型,激发其在下游任务上的多模态深度推理能力。

  清华大学 AIR 和水木分子研究团队表示,将长期持续维护 OpenBioMed 开源平台,团队现阶段探索方向是如何在强推理语言模型的基础上更好地适应性地实现跨模态对齐,团队正在以 BioMedGPT-R1 为基础进行系统性研究与综合评估,附开源地址如下,当前新版本还未开源:

下一篇:国产动作 RPG《失落之魂》开启预购,Steam 国区
上一篇:英伟达推出 Signs 平台:AI 突破美式手语学习,助
返回顶部小火箭