报告称 OpenAI 采集了超一百万小时的 YouTube 来训练
OpenAI公司知道这在法律上存在问题,但认为这是合理使用。OpenAI 发言人 Lindsay Held 在一封电子邮件中告诉 The Verge,该公司为其每个模型策划了“独特”的数据集,以“帮助他们了解世界”并保持其全球研究竞争力。Held 补充说,该公司使用“众多谷歌发言人 Matt Bryant 在一封电子邮件中表示,该公司“看到了有关 OpenAI 活动的未经证实的报告”,并补充说“我们的 robots.txt 文件和服务条款都禁止未经授权的抓取或下载 YouTube 内容”。
YouTube 首席执行官 Neal Mohan 近日在中公开表示,尽管没有直接证据表明 OpenAI 使用 YouTube 来训练 Sora,但警告称这种行为违反了 YouTube 现行的平台服务条款。
Meta 同样也遇到了数据可用性的限制,在