清华大学合作推出看图答题小能手 CogAgent

2023-12-27 14:52:35

　　清华 KEG 实验室近日和智谱 AI 合作，

　　该模型基于此前推出的 CogVLM，通过

　　CogAgent 可以接受 1120×1120 的高分辨率图像输入，具备例如，用户输入一张关于 CogVLM 项目的 GitHub 的，然后询问如何给这个项目点“Star”，然后 CogAgent 就会反馈出结果。

　　例如用户输入一张原神游戏的，可以询问“当前任务中的队友是谁？”，CogAgent 会给出相关的回答。

　　附上相关信息地址如下：

　　论文：Demo：Streamlit代码：