🤖 DeepSeek-V3-0324发布:开源AI模型性能跃升,挑战商业巨头

DeepSeek低调发布6850亿参数的DeepSeek-V3-0324模型,采用MIT许可,可免费商用。该模型采用混合专家(MoE)架构,仅激活部分参数(370亿)即可实现与更大模型相当的性能,显著降低计算需求。

主要亮点:

* 性能提升: 早期测试显示,DeepSeek-V3-0324在各项指标上均优于前一版本,甚至可能超越Anthropic的Claude Sonnet 3.5。
* 效率突破: 结合多头潜在注意力(MLA)和多token预测(MTP)技术,输出速度提升近80%。4比特量化版本可在配备M3 Ultra芯片的Mac Studio上运行,推理功耗不到200瓦。
* 开源策略: DeepSeek采用开源策略,与OpenAI等西方公司的封闭模式形成对比,推动中国AI生态系统快速发展。
* 推理能力: 预示未来将发布推理专用模型DeepSeek-R2,可能挑战GPT-5。
* 易用性: 完整模型权重已在Hugging Face发布,可通过OpenRouter等平台免费访问。
* 风格转变: 新模型交流风格更偏向技术性,可能更适合专业应用。

影响:

DeepSeek的开源战略正在重塑全球AI版图,加速AI技术普及和应用,缩小中美AI差距。开源模式可能凭借广泛普及和开发者集体创新,在竞争中超越闭源系统。

(IT业界资讯)

via 茶馆 - Telegram Channel
 
 
Back to Top
oaibest.com 2023-2025
admin@oaibest.com