🤖 Meta 涉嫌使用盗版数据训练 AI 模型,加速追赶 OpenAI

Meta 公司内部文件泄露,显示其为追赶 OpenAI 的 GPT-4,曾使用盗版图书网站 Library Genesis (LibGen) 的数据训练 Llama AI 模型。Meta 内部邮件显示,高管讨论了通过移除版权头和避免外部引用 LibGen 数据等方式来“缓解”侵权风险。文件还揭示了 Meta 意识到使用盗版内容可能带来的法律和监管风险,以及媒体曝光的担忧。此外,Meta 还面临数据短缺问题,曾考虑收购西蒙与舒斯特出版社,并雇佣承包商在未经许可的情况下总结书籍。目前,Meta 正面临作者和喜剧演员的诉讼,指控其非法使用受版权保护的内容,而 Meta 则辩称其行为属于合理使用。

(The Verge)

via 茶馆 - Telegram Channel
 
 
Back to Top