Meta AI提出了一种新的语言模型架构“Large Concept Model (LCM)
让模型更像人类思考,先从大框架入手,再填充细节。
与传统语言模型(比如GPT)逐字生成不同
LCM基于“概念”(concept)进行语言处理,把每个句子看作一个“概念”,在句子级别进行推理和生成,而不是在token级别操作。
在LCM中,一个概念通常对应一个完整的句子,它是语言和模态无关的高级语义表示。
让模型从更高的抽象层次进行推理和生成,超越现有模型局限,处理更复杂的任务。
- 思考方式像人类,从“概念”出发,逻辑更清晰。
- 能处理多语言、多模态任务,直接支持文本、语音甚至手语。支持200种语言的文本输入。76种语言的语音输入。
- 适合长文本处理,速度快,生成内容更连贯。
- 具备强大的零样本泛化能力,不用额外训练也能完成新任务。
----------------------
Wed Dec 25 2024 11:17:01 GMT+0800 (China Standard Time)
via Twitter @小互