🤖 Meta 涉嫌使用盗版数据训练 AI 模型，加速追赶 OpenAIMeta 公司内部文件泄露，显示其为追赶 OpenAI 的 GPT-4，曾使用盗版图书网站 Library Genesis (LibGen) 的数据训练 Llama AI 模型

🤖 Meta 涉嫌使用盗版数据训练 AI 模型，加速追赶 OpenAI

Meta 公司内部文件泄露，显示其为追赶 OpenAI 的 GPT-4，曾使用盗版图书网站 Library Genesis (LibGen) 的数据训练 Llama AI 模型。Meta 内部邮件显示，高管讨论了通过移除版权头和避免外部引用 LibGen 数据等方式来“缓解”侵权风险。文件还揭示了 Meta 意识到使用盗版内容可能带来的法律和监管风险，以及媒体曝光的担忧。此外，Meta 还面临数据短缺问题，曾考虑收购西蒙与舒斯特出版社，并雇佣承包商在未经许可的情况下总结书籍。目前，Meta 正面临作者和喜剧演员的诉讼，指控其非法使用受版权保护的内容，而 Meta 则辩称其行为属于合理使用。

(The Verge)

via 茶馆 - Telegram Channel