小互: 重磅💥

Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)

让模型更像人类思考,先从大框架入手,再填充细节。

与传统语言模型(比如GPT)逐字生成不同

LCM基于“概念”(concept)进行语言处理,把每个句子看作一个“概念”,在句子级别进行推理和生成,而不是在token级别操作。

在LCM中,一个概念通常对应一个完整的句子,它是语言和模态无关的高级语义表示。

让模型从更高的抽象层次进行推理和生成,超越现有模型局限,处理更复杂的任务。

- 思考方式像人类,从“概念”出发,逻辑更清晰。

- 能处理多语言、多模态任务,直接支持文本、语音甚至手语。支持200种语言的文本输入。76种语言的语音输入。

- 适合长文本处理,速度快,生成内容更连贯。

- 具备强大的零样本泛化能力,不用额外训练也能完成新任务。

----------------------
Wed Dec 25 2024 11:17:01 GMT+0800 (China Standard Time)

via Twitter @小互
 
 
Back to Top