🤖 DeepSeek-V3-0324发布：开源AI模型性能跃升，挑战商业巨头DeepSeek低调发布6850亿参数的DeepSeek-V3-0324模型，采用MIT许可，可免费商用

🤖 DeepSeek-V3-0324发布：开源AI模型性能跃升，挑战商业巨头

DeepSeek低调发布6850亿参数的DeepSeek-V3-0324模型，采用MIT许可，可免费商用。该模型采用混合专家（MoE）架构，仅激活部分参数（370亿）即可实现与更大模型相当的性能，显著降低计算需求。

主要亮点：

* 性能提升： 早期测试显示，DeepSeek-V3-0324在各项指标上均优于前一版本，甚至可能超越Anthropic的Claude Sonnet 3.5。
* 效率突破： 结合多头潜在注意力（MLA）和多token预测（MTP）技术，输出速度提升近80%。4比特量化版本可在配备M3 Ultra芯片的Mac Studio上运行，推理功耗不到200瓦。
* 开源策略： DeepSeek采用开源策略，与OpenAI等西方公司的封闭模式形成对比，推动中国AI生态系统快速发展。
* 推理能力： 预示未来将发布推理专用模型DeepSeek-R2，可能挑战GPT-5。
* 易用性： 完整模型权重已在Hugging Face发布，可通过OpenRouter等平台免费访问。
* 风格转变： 新模型交流风格更偏向技术性，可能更适合专业应用。

影响：

DeepSeek的开源战略正在重塑全球AI版图，加速AI技术普及和应用，缩小中美AI差距。开源模式可能凭借广泛普及和开发者集体创新，在竞争中超越闭源系统。

(IT业界资讯)

via 茶馆 - Telegram Channel