🤖 Mistral AI 发布新型 AI 模型 Mistral Small 3
欧洲人工智能公司 Mistral AI 发布了新的小型模型 Mistral Small 3,该模型拥有 240 亿参数,性能可与 Llama 3.3 70B 和 Qwen 32B 等大型模型媲美,尤其在 MMLU-Pro 基准测试中表现突出。Mistral Small 3 的运行速度与 Llama 3.3 70B 相当,甚至更快,且性能优于 ChatGPT 的备用模型 GPT-4o mini,延迟更低。该模型在 Apache 2.0 许可下发布,可作为开源社区的基础模型。Mistral Small 3 未使用强化学习或合成数据训练,可在单块 NVIDIA RTX 4090 显卡或配备 32GB 内存的 MacBook 上本地运行。尽管在 MMLU-Pro 基准测试中表现出色,但在人类评估中,其首选度低于 Llama 3.3 70B 和 GPT-4o mini。Mistral Small 3 现已在平台上提供,版本为 mistral-small-latest 或 mistral-small-2501。
(IT业界资讯)
via 茶馆 - Telegram Channel
欧洲人工智能公司 Mistral AI 发布了新的小型模型 Mistral Small 3,该模型拥有 240 亿参数,性能可与 Llama 3.3 70B 和 Qwen 32B 等大型模型媲美,尤其在 MMLU-Pro 基准测试中表现突出。Mistral Small 3 的运行速度与 Llama 3.3 70B 相当,甚至更快,且性能优于 ChatGPT 的备用模型 GPT-4o mini,延迟更低。该模型在 Apache 2.0 许可下发布,可作为开源社区的基础模型。Mistral Small 3 未使用强化学习或合成数据训练,可在单块 NVIDIA RTX 4090 显卡或配备 32GB 内存的 MacBook 上本地运行。尽管在 MMLU-Pro 基准测试中表现出色,但在人类评估中,其首选度低于 Llama 3.3 70B 和 GPT-4o mini。Mistral Small 3 现已在平台上提供,版本为 mistral-small-latest 或 mistral-small-2501。
(IT业界资讯)
via 茶馆 - Telegram Channel