🚀腾讯发布“混元T1”超大型推理模型:速度与成本优势显著腾讯昨晚深夜正式推出基于混合Mamba-Transformer架构的超大型推理模型“混元T1”,并在腾讯云上线。T1模型结合了Mamba和Transformer的优势,降低了推理成本和KV-Cache占用。其吐字速度可达60-80 token/s,显著快于DeepSeek R1。在MMLU-pro、CEval等多个测试中,T1表现与DeepSeek R1和OpenAI o1相当或更优。T1正式版已在腾讯云面向API用户开放,输入/输出价格分别为1元/百万tokens和4元/百万tokens,约为DeepSeek R1标准时段价格的四分之一。未来可能更多通过元宝等自家业务向C端用户开放。
(IT业界资讯)via
茶馆 - Telegram Channel