🚀腾讯发布“混元T1”超大型推理模型：速度与成本优势显著腾讯昨晚深夜正式推出基于混合Mamba-Transformer架构的超大型推理模型“混元T1”，并在腾讯云上线

🚀腾讯发布“混元T1”超大型推理模型：速度与成本优势显著

腾讯昨晚深夜正式推出基于混合Mamba-Transformer架构的超大型推理模型“混元T1”，并在腾讯云上线。T1模型结合了Mamba和Transformer的优势，降低了推理成本和KV-Cache占用。其吐字速度可达60-80 token/s，显著快于DeepSeek R1。在MMLU-pro、CEval等多个测试中，T1表现与DeepSeek R1和OpenAI o1相当或更优。T1正式版已在腾讯云面向API用户开放，输入/输出价格分别为1元/百万tokens和4元/百万tokens，约为DeepSeek R1标准时段价格的四分之一。未来可能更多通过元宝等自家业务向C端用户开放。

(IT业界资讯)

via 茶馆 - Telegram Channel