清华大学合作推出看图答题小能手 CogAgent

2023-12-27 14:52:35

  清华 KEG 实验室近日和智谱 AI 合作,

  该模型基于此前推出的 CogVLM,通过

  CogAgent 可以接受 1120×1120 的高分辨率图像输入,具备例如,用户输入一张关于 CogVLM 项目的 GitHub 的,然后询问如何给这个项目点“Star”,然后 CogAgent 就会反馈出结果。

  例如用户输入一张原神游戏的,可以询问“当前任务中的队友是谁?”,CogAgent 会给出相关的回答。

  附上相关信息地址如下:

  论文:Demo:Streamlit代码:

下一篇:韩国首尔明年将启用无人机及人工智能监控交通状况
上一篇:极氪 001 车型迎来 OS 5.1 版本升级:新增红绿灯倒计时等
返回顶部小火箭