科技巨头被曝未经授权用 YouTube 内容训练 AI,苹

2024-07-16 22:50:30

  包括苹果在内的一些科技巨头未经 YouTube 创下载这些字幕文件的是一个名为 EleutherAI 的非盈利组织,他们声称其目的是帮助开发者训练 AI 模型。虽然 EleutherAI 的初衷可能是为小型开发者和学术研究者提供训练材料,但该数据集也被苹果等科技巨头使用。

  根据 EleutherAI 发布的一篇研究论文,这份数据集是他们发布的名为“The Pile”的大型数据集的一部分。“The Pile”中的大部分数据集都是公开的,任何拥有足够存储空间和计算能力的人都可以访问。除了科技巨头之外,一些学者和开发者也使用了该数据集。然而,苹果、英伟达和 Salesforce 等市值数百亿甚至数千亿美元的公司也在他们的研究论文和帖子中提到了他们如何使用该数据集来训练 AI 模型。

  有文件显示,需要注意的是,尽管苹果和其他公司可能使用了公开的数据集,但此事件凸显了从网络上抓取数据来训练 AI 系统所带来的法律风险。此前就曾出现过 AI 系统在回答小众话题时抄袭整段文本的案例,当公司使用第三方编译的数据集时,只会增加未经许可使用素材的风险。

下一篇:一加 Pad 2 旗舰平板海外发布:搭载骁龙 8 Gen 3、
上一篇:保时捷扩充纯电 Macan 车型阵容:后驱版、4S 版齐
返回顶部小火箭