🚀 MiniMax发布两款突破性大模型,成本降低10倍引发AI革命
MiniMax发布了基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01,这两款模型均采用了新型Lightning Attention架构,首次大规模实现了线性注意力机制,将计算复杂度从二次降低到线性,显著提升了模型训练速度。
MiniMax-Text-01:* 在MMLU基准测试中,得分与DeepSeek-V3同为88.5分,高于GPT-4o的85.7分。
* 在GPQA Diamond数据集上取得54.4分,超过多数开源指令微调LLM及最新版GPT-4o。
* 可高效处理超过百万字符的长文本,延迟更低,稳定性更强。
* 在长上下文理解方面,128K输入级别超越所有基准模型,且性能衰减最慢。
MiniMax-VL-01:* 基于MiniMax-Text-01模型开发,集成了图像编码器和适配器。
* 在VQA(视觉问答)任务中表现与GPT-4o相当。
* 处理数据集总量达到5120亿token。
其他关键信息:* MiniMax 01模型成本比GPT-4o低10倍。
* 模型参数达4560亿,每次激活459亿。
* 模型权重完全开源,并提供API服务,价格为业内最低。
* MiniMax认为2025年是AI Agent时代,并已推出海螺AI等应用。
* 已为40000+企业和开发者提供API服务。
* MiniMax采用“全模态模型+APP产品+开放平台”的增长模式。
(IT业界资讯)via
茶馆 - Telegram Channel