🚀 MiniMax发布两款突破性大模型，成本降低10倍引发AI革命MiniMax发布了基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01，这两款模型均采用了新型Lightning Attention架构，首次大规模实现了线性注意力机制，将计算复杂度从二次降低到线性，显著提升了模型训练速度

🚀 MiniMax发布两款突破性大模型，成本降低10倍引发AI革命

MiniMax发布了基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01，这两款模型均采用了新型Lightning Attention架构，首次大规模实现了线性注意力机制，将计算复杂度从二次降低到线性，显著提升了模型训练速度。

MiniMax-Text-01：
* 在MMLU基准测试中，得分与DeepSeek-V3同为88.5分，高于GPT-4o的85.7分。
* 在GPQA Diamond数据集上取得54.4分，超过多数开源指令微调LLM及最新版GPT-4o。
* 可高效处理超过百万字符的长文本，延迟更低，稳定性更强。
* 在长上下文理解方面，128K输入级别超越所有基准模型，且性能衰减最慢。

MiniMax-VL-01：
* 基于MiniMax-Text-01模型开发，集成了图像编码器和适配器。
* 在VQA（视觉问答）任务中表现与GPT-4o相当。
* 处理数据集总量达到5120亿token。

其他关键信息：
* MiniMax 01模型成本比GPT-4o低10倍。
* 模型参数达4560亿，每次激活459亿。
* 模型权重完全开源，并提供API服务，价格为业内最低。
* MiniMax认为2025年是AI Agent时代，并已推出海螺AI等应用。
* 已为40000+企业和开发者提供API服务。
* MiniMax采用“全模态模型+APP产品+开放平台”的增长模式。

(IT业界资讯)

via 茶馆 - Telegram Channel