🤖 低成本AI模型复制引争议:研究人员用450美元复刻Gemini 2.0 Flash Thinking Experimental

* 事件概述: 一个名为s1的项目,通过模型蒸馏技术,以低成本(约450美元)复制了Google的Gemini 2.0 Flash Thinking Experimental的推理能力,引发了关于AI模型商品化和知识产权的讨论。
* 技术细节: s1基于阿里巴巴的Qwen模型,使用16个NVIDIA H100 GPU和包含1000个问题的精选数据集进行训练。研究人员还发现,在推理中加入“等待”一词可以提高模型准确性。
* 争议焦点: OpenAI指责DeepSeek不正当收集其API数据进行模型蒸馏。Google的条款禁止对其模型进行逆向工程。
* 未来趋势: Meta、Google和Microsoft计划在2025年在AI基础设施上投资数千亿美元,但模型蒸馏技术可能降低AI开发的门槛。

(IT业界资讯)

via 茶馆 - Telegram Channel
 
 
Back to Top