苹果展示 AI 新模型 MGIE,可一句话精修
相比较微软的风生水起,苹果公司在 AI 领域的布局显得低调很多,但这并不意味着苹果在该领域就没有丝毫建树。
MGIE 的全称是 MLLM-Guided Image Editing,利用多模态大型语言模型解释用户指令并执行像素级操作。MGIE 可以理解用户下达的自然语言命令,进行 Photoshop 风格的修改、全局照片优化和局部
苹果公司和加州大学圣巴巴拉分校研究人员合作,在 2024 年国际学习表征会议上发表 MGIE 相关研究成果,而 ICLR 是人工智能研究的顶级会议之一。
介绍 MGIE 之前,先来介绍下 MLLM。MLLM 是一种强大的人工智能模型,可以同时处理文本和图像,从而增强基于指令的图像
MGIE 通过两种方式将 MLLMs 集成到图像例如,当输入“其次,它使用 MLLM 生成MGIE 可以处理各种
MGIE 是 GitHub 上的一个开源项目,用户可以点击这里找到代码、数据和预训练模型。该项目还提供了一个演示笔记本,展示如何使用 MGIE 完成各种
