🤖 低成本AI模型复制引争议：研究人员用450美元复刻Gemini 2.0 Flash Thinking Experimental* 事件概述：一个名为s1的项目，通过模型蒸馏技术，以低成本（约450美元）复制了Google的Gemini 2.0 Flash Thinking Experimental的推理能力，引发了关于AI模型商品化和知识产权的讨论

🤖 低成本AI模型复制引争议：研究人员用450美元复刻Gemini 2.0 Flash Thinking Experimental

* 事件概述： 一个名为s1的项目，通过模型蒸馏技术，以低成本（约450美元）复制了Google的Gemini 2.0 Flash Thinking Experimental的推理能力，引发了关于AI模型商品化和知识产权的讨论。
* 技术细节： s1基于阿里巴巴的Qwen模型，使用16个NVIDIA H100 GPU和包含1000个问题的精选数据集进行训练。研究人员还发现，在推理中加入“等待”一词可以提高模型准确性。
* 争议焦点： OpenAI指责DeepSeek不正当收集其API数据进行模型蒸馏。Google的条款禁止对其模型进行逆向工程。
* 未来趋势： Meta、Google和Microsoft计划在2025年在AI基础设施上投资数千亿美元，但模型蒸馏技术可能降低AI开发的门槛。

(IT业界资讯)

via 茶馆 - Telegram Channel