开放源代码促进会：开源 AI 必须披露其训练数据开放源代码促进会 (OSI) 发布了“Open”人工智能的官方定义

开放源代码促进会：开源 AI 必须披露其训练数据

开放源代码促进会 (OSI) 发布了“Open”人工智能的官方定义。OSI 长期以来一直为开源软件的构成设定行业标准，但人工智能系统包含传统许可未涵盖的元素，例如模型训练数据。现在，要使AI系统被视为真正的开源系统，必须提供：可访问用于训练AI的数据的详细信息，以便其他人可以理解和重新创建；用于构建和运行AI的完整代码；训练中的设置和权重，帮助AI产生相应的结果。

该定义直接挑战了 Meta 的 Llama，后者被广泛宣传为最大的开源 AI 模型。Llama 可供公众下载和使用，但其商业用途受到限制。且不提供对训练数据的访问，这导致其不符合 OSI 的无限制使用、修改和共享自由标准。

—— TheVerge

via 风向旗参考快讯 - Telegram Channel