🤖 AI 认知能力研究:大型语言模型表现出类似人类轻度认知障碍

一项发表在《英国医学杂志》上的研究发现,包括 ChatGPT-4o、Gemini 和 Claude 等在内的多个大型语言模型在认知测试中表现出类似人类轻度认知障碍的症状。研究使用蒙特利尔认知评估量表(MoCA)对这些 AI 模型进行评估,满分 30 分,26 分以上为正常。结果显示,表现最佳的 ChatGPT-4o 仅达到 26 分及格线,其他模型如 ChatGPT-4 和 Claude 为 25 分,而 Gemini 1.0 仅为 16 分。这些模型在视觉空间和执行功能测试中表现较差,例如连线测试和时钟绘制测试,与人类轻度认知障碍患者的表现相似。此外,Gemini 模型在记忆测试中出现“健忘”现象,且在处理 Navon 图形、偷饼干图片等测试材料时,难以整合局部与整体信息,识别复杂场景中的物体。研究还发现,AI 模型的早期版本表现更差,暗示模型迭代可能提升认知能力。尽管 AI 在某些医学考试中表现出色,但其认知缺陷,尤其是在视觉抽象能力方面的不足,引发了人们对其在医疗领域应用的担忧。研究强调,医疗需要人文关怀和同理心,AI 应作为辅助工具而非决策者。未来,提升 AI 模型的共情能力和情境理解能力将是研究重点。

(IT业界资讯)

via 茶馆 - Telegram Channel
 
 
Back to Top