🚀 OpenAI推出经济高效的o1-mini模型用于STEM推理OpenAI引入了o1-mini，这是一款为数学和编程等STEM应用优化的经济型推理模型

🚀 OpenAI推出经济高效的o1-mini模型用于STEM推理

OpenAI引入了o1-mini，这是一款为数学和编程等STEM应用优化的经济型推理模型。该模型于2024年9月12日发布，提供给第5级API用户，其成本比之前的o1-preview版本降低了80%。在关键基准测试中，如AIME（70.0%对74.4%）和Codeforces（1650 Elo对1673），o1-mini几乎与其前身相当，同时在速度和效率方面显著优于前者。

该模型特别擅长高中水平的数学竞赛和编程挑战，以竞争性的成绩跻身顶尖表现者之列——在AIME上答对15道题中的11道，并在Codeforces上排名进入顶尖百分位。

尽管有这些优势，由于其专注训练方向，o1-mini在处理非STEM事实知识任务时表现有所下降。然而，它显示出改进的安全特性，其越狱鲁棒性评分高于GPT-4o型号。

未来更新旨在通过拓宽其能力范围超越STEM领域来增强这些局限性，同时通过严格评估确保部署前保持强大的安全标准。

(@OpenAI)

via 老裕泰 - Telegram Channel