OpenAI状态页通知 | 汇集全网ChatGPT/AI新闻
🔖标签:#AI #ChatGPT
🌐免费AI聊天: https://free.netfly.top
🪜API中转: https://api.oaibest.com (OpenAI/GPTs/高级语音/Claude/联网/文件分析/MJ画图)
📎服务发布页: https://link3.cc/gpt123
Buy ads: https://telega.io/c/AI_News_CN
🔖标签:#AI #ChatGPT
🌐免费AI聊天: https://free.netfly.top
🪜API中转: https://api.oaibest.com (OpenAI/GPTs/高级语音/Claude/联网/文件分析/MJ画图)
📎服务发布页: https://link3.cc/gpt123
Buy ads: https://telega.io/c/AI_News_CN
Meta 研究员认为大模型比猫还蠢
2024-10-14 11:05 by 人性分解
Meta 高级研究员、纽约大学教授 Yann LeCun 认为有关 AI 威胁人类的担忧都是一派胡言。他喜欢用猫打比方,猫科动物拥有物理世界的心理模型、持久记忆、有限的推理能力和规划能力。而这一切最先进的大模型并不拥有。Yann LeCun 于 2018 年因在深度学习上的贡献而与 Yoshua Bengio 和 Geoffrey Hinton 一起获得图灵奖,其中 Geoffrey Hinton 还在今年获得了诺贝尔奖。LeCun 认为 AI 是一种强大的工具,但今天的 AI 在任何意义上都称不上智能。然而科技行业的许多人,尤其是 AI 创业公司,正在以荒诞的方式轻信预测其近期的进展。他认为创造通用 AI 可能需要几十年的时间,而今天的主流方法无法让我们实现这一目标。大模型只是在预测文本的下一个单词,受益于其巨大的记忆容量,它们似乎在进行推理,但实际只是机械重复已经训练的信息。
https://tech.slashdot.org/story/24/10/13/2220258/ai-threats-complete-bs-says-meta-senior-research-who-thinks-ai-is-dumber-than-a-cat
#人工智能
via Solidot - Telegram Channel
2024-10-14 11:05 by 人性分解
Meta 高级研究员、纽约大学教授 Yann LeCun 认为有关 AI 威胁人类的担忧都是一派胡言。他喜欢用猫打比方,猫科动物拥有物理世界的心理模型、持久记忆、有限的推理能力和规划能力。而这一切最先进的大模型并不拥有。Yann LeCun 于 2018 年因在深度学习上的贡献而与 Yoshua Bengio 和 Geoffrey Hinton 一起获得图灵奖,其中 Geoffrey Hinton 还在今年获得了诺贝尔奖。LeCun 认为 AI 是一种强大的工具,但今天的 AI 在任何意义上都称不上智能。然而科技行业的许多人,尤其是 AI 创业公司,正在以荒诞的方式轻信预测其近期的进展。他认为创造通用 AI 可能需要几十年的时间,而今天的主流方法无法让我们实现这一目标。大模型只是在预测文本的下一个单词,受益于其巨大的记忆容量,它们似乎在进行推理,但实际只是机械重复已经训练的信息。
https://tech.slashdot.org/story/24/10/13/2220258/ai-threats-complete-bs-says-meta-senior-research-who-thinks-ai-is-dumber-than-a-cat
#人工智能
via Solidot - Telegram Channel
大模型容易遭到越狱攻击
2024-10-14 09:56 by 时间秘史
大模型容易遭到攻击,容易泄露敏感数据。加拿大安全公司 Pillar Security 发表了《State of Attacks on GenAI》报告,基于遥测数据和逾 2000 AI 应用的真实攻击示例,揭示了大模型攻击和越狱的新见解。研究人员发现,对大模型的攻击平均只需要 42 秒,越狱成功率 20%。逾 2000 AI 应用中最常见的是提供虚拟客户支持的聊天机器人,占到了总数的 57.6%。常见的越狱方法包括使用指令 ignore previous instructions 和 ADMIN override,或者只使用 base64 编码。研究人员报告,最短的攻击只需要 4 秒,最长的需要 14 分钟。
https://www.pillar.security/resources/the-state-of-attacks-on-genai
https://it.slashdot.org/story/24/10/12/213247/llm-attacks-take-just-42-seconds-on-average-20-of-jailbreaks-succeed
#人工智能
via Solidot - Telegram Channel
2024-10-14 09:56 by 时间秘史
大模型容易遭到攻击,容易泄露敏感数据。加拿大安全公司 Pillar Security 发表了《State of Attacks on GenAI》报告,基于遥测数据和逾 2000 AI 应用的真实攻击示例,揭示了大模型攻击和越狱的新见解。研究人员发现,对大模型的攻击平均只需要 42 秒,越狱成功率 20%。逾 2000 AI 应用中最常见的是提供虚拟客户支持的聊天机器人,占到了总数的 57.6%。常见的越狱方法包括使用指令 ignore previous instructions 和 ADMIN override,或者只使用 base64 编码。研究人员报告,最短的攻击只需要 4 秒,最长的需要 14 分钟。
https://www.pillar.security/resources/the-state-of-attacks-on-genai
https://it.slashdot.org/story/24/10/12/213247/llm-attacks-take-just-42-seconds-on-average-20-of-jailbreaks-succeed
#人工智能
via Solidot - Telegram Channel
苹果取消道路测试许可证 造车计划正式告吹
近日,外媒报道苹果(AAPL.US)公司已要求加州机动车辆管理局(DMV)取消其自动驾驶汽车测试许可证,这显示苹果的造车计划已正式终止。根据报道,该测试许可证并非被动回收,而是苹果在9月25日主动提交的取消请求。
苹果的自动驾驶专案Titan近来遭遇多次挫折,早前已将自动驾驶等级从L4降低至L2+,并传出内部已取消该计划,影响约2000名员工。苹果目前将大部分人员转移至AI部门,专注于自动生成式人工智能技术的发展,未来可能会与车厂合作推动智慧驾驶体验。
鉅亨網
📮 热点投稿 @ZaiHuabot
🧧 双11全品抵扣 m.fanli.me
via 科技圈🎗在花频道📮 - Telegram Channel
近日,外媒报道苹果(AAPL.US)公司已要求加州机动车辆管理局(DMV)取消其自动驾驶汽车测试许可证,这显示苹果的造车计划已正式终止。根据报道,该测试许可证并非被动回收,而是苹果在9月25日主动提交的取消请求。
苹果的自动驾驶专案Titan近来遭遇多次挫折,早前已将自动驾驶等级从L4降低至L2+,并传出内部已取消该计划,影响约2000名员工。苹果目前将大部分人员转移至AI部门,专注于自动生成式人工智能技术的发展,未来可能会与车厂合作推动智慧驾驶体验。
鉅亨網
📮 热点投稿 @ZaiHuabot
🧧 双11全品抵扣 m.fanli.me
via 科技圈🎗在花频道📮 - Telegram Channel
Adobe 开始推出生成式人工智能视频工具
当地时间14日,Adobe 表示已经开始公开发布一种可以根据文本提示生成视频的人工智能模型,加入了越来越多试图利用生成人工智能颠覆影视制作的公司行列。这项技术被称为 Firefly 视频模型,将与 OpenAI于今年早些时候推出的 Sora 展开竞争。Adobe 将开始向已加入等候名单的用户开放该工具,但并未透露具体发布日期。Adobe 公司表示其视频编辑软件 Premiere 中集成了一项功能,让用户能够使用生成式人工智能来扩展视频片段。其他可在线获取的工具让用户能够根据文本提示和现有图像制作视频。
—— 路透社、彭博社
via 风向旗参考快讯 - Telegram Channel
当地时间14日,Adobe 表示已经开始公开发布一种可以根据文本提示生成视频的人工智能模型,加入了越来越多试图利用生成人工智能颠覆影视制作的公司行列。这项技术被称为 Firefly 视频模型,将与 OpenAI于今年早些时候推出的 Sora 展开竞争。Adobe 将开始向已加入等候名单的用户开放该工具,但并未透露具体发布日期。Adobe 公司表示其视频编辑软件 Premiere 中集成了一项功能,让用户能够使用生成式人工智能来扩展视频片段。其他可在线获取的工具让用户能够根据文本提示和现有图像制作视频。
—— 路透社、彭博社
via 风向旗参考快讯 - Telegram Channel
预计台积电今年第三季度净利润将增长40%
根据 LSEG SmartEstimate 从 22 位分析师那里收集的数据,预计台积电 2024 年第三季度的净利润将达到 2982 亿新台币,约合 92.7 亿美元,与去年同期相比将增长 40%。
利润激增的主要原因有两个:越来越多的公司向台积电下芯片订单,以在人工智能热潮中占据优势;苹果、高通和联发科等客户希望在今年凭借 3nm“N3E”产品占据上风。到目前为止,台积电似乎没有遇到竞争对手的竞争,就连三星也因产量不稳定而未能为其下一代 3nm GAA 产量吸引新客户。
—— wccftech,韩国时报
via 风向旗参考快讯 - Telegram Channel
根据 LSEG SmartEstimate 从 22 位分析师那里收集的数据,预计台积电 2024 年第三季度的净利润将达到 2982 亿新台币,约合 92.7 亿美元,与去年同期相比将增长 40%。
利润激增的主要原因有两个:越来越多的公司向台积电下芯片订单,以在人工智能热潮中占据优势;苹果、高通和联发科等客户希望在今年凭借 3nm“N3E”产品占据上风。到目前为止,台积电似乎没有遇到竞争对手的竞争,就连三星也因产量不稳定而未能为其下一代 3nm GAA 产量吸引新客户。
—— wccftech,韩国时报
via 风向旗参考快讯 - Telegram Channel
@MKBHD :如何在 54 分 19 秒 20 毫秒内制作高质量油管视频
继 MRBEAST 内部培训手册曝光后,YouTube 知名科技博主 @MKBHD 发布了一个 54 分 19 秒 20 毫秒的视频,讲述了他们是如何通过组建团队提升视频制作质量,并使用“章鱼”的比喻来说明团队协作的重要性。
视频深入介绍了创作过程的各个环节,从构思、脚本、拍摄到剪辑、灯光和缩略图设计,并展示了各个团队成员的具体工作及其对提升视频质量的贡献。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
加入会员
加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员
via XiaoHu.AI学院 (author: 小互)
继 MRBEAST 内部培训手册曝光后,YouTube 知名科技博主 @MKBHD 发布了一个 54 分 19 秒 20 毫秒的视频,讲述了他们是如何通过组建团队提升视频制作质量,并使用“章鱼”的比喻来说明团队协作的重要性。
视频深入介绍了创作过程的各个环节,从构思、脚本、拍摄到剪辑、灯光和缩略图设计,并展示了各个团队成员的具体工作及其对提升视频质量的贡献。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
加入会员
加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员
via XiaoHu.AI学院 (author: 小互)
AI PC 未提振 PC 需求
2024-10-13 12:00 by 图书馆员与黄金锅
尽管围绕 AI PC 有很多炒作,但 PC 市场没有出现多少反弹迹象。Gartner 的数据显示,三季度 PC 出货量同比下降 1.3% 至 6290 万台,而今年二季度的出货量为 6490 万台。AI PC 本应该激发消费者的购买热情,刺激略微低迷的 PC 市场,但买家并没有看到 AI PC 显而易见的好处或商业价值。目前 AI PC 在很大程度上还只是一个营销概念,供应商尚未对其具体定义达成一致。虽然三季度推出了运行 Windows 的 Arm 和 x86 AI PC,但购买 Arm 的 AI PC 买家发现,部分程序的运行性能表现不佳。如果 Windows 应用没有原生支持 Arm 的版本,那么程序需要通过兼容层才能正常工作,这需要额外的开销。
https://hardware.slashdot.org/story/24/10/12/0311250/pc-shipments-stuck-in-neutral-despite-ai-buzz
#硬件
via Solidot - Telegram Channel
2024-10-13 12:00 by 图书馆员与黄金锅
尽管围绕 AI PC 有很多炒作,但 PC 市场没有出现多少反弹迹象。Gartner 的数据显示,三季度 PC 出货量同比下降 1.3% 至 6290 万台,而今年二季度的出货量为 6490 万台。AI PC 本应该激发消费者的购买热情,刺激略微低迷的 PC 市场,但买家并没有看到 AI PC 显而易见的好处或商业价值。目前 AI PC 在很大程度上还只是一个营销概念,供应商尚未对其具体定义达成一致。虽然三季度推出了运行 Windows 的 Arm 和 x86 AI PC,但购买 Arm 的 AI PC 买家发现,部分程序的运行性能表现不佳。如果 Windows 应用没有原生支持 Arm 的版本,那么程序需要通过兼容层才能正常工作,这需要额外的开销。
https://hardware.slashdot.org/story/24/10/12/0311250/pc-shipments-stuck-in-neutral-despite-ai-buzz
#硬件
via Solidot - Telegram Channel
One-Click Creative Template:创意模型 用一张卡通图片总结4张真实人物照片
FLUX.1-dev-LoRA-One-Click-Creative-Template 是由 Shakker Labs 提供的一个用于 文本生成图像(Text-to-Image) 的模板模型,专为创造性照片生成而设计。
模型会根据你的输入提示词生成 4 张背景照片,背景部分由 4 张真实照片组成,并在其中央插入一张卡通风格的图像,作为对整个场景的总结。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
加入会员
加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员
via XiaoHu.AI学院 (author: 小互)
FLUX.1-dev-LoRA-One-Click-Creative-Template 是由 Shakker Labs 提供的一个用于 文本生成图像(Text-to-Image) 的模板模型,专为创造性照片生成而设计。
模型会根据你的输入提示词生成 4 张背景照片,背景部分由 4 张真实照片组成,并在其中央插入一张卡通风格的图像,作为对整个场景的总结。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
加入会员
加入会员查看更多会员内容和教程。
超过1000+的会员内容,每天更新。
开通会员
via XiaoHu.AI学院 (author: 小互)
台湾官员称台积电计划在欧洲建立更多芯片工厂
据台湾官员透露,台积电正计划在欧洲建立更多工厂,重点关注人工智能芯片市场,以扩大其全球业务版图。台湾国家科学及技术委员会主任委员吴诚文表示:“台积电已经开始在德国德累斯顿建设第一座晶圆厂,并计划在未来针对不同的市场领域建设几座晶圆厂。”台积电称,该公司仍将重点关注当前的全球扩张项目,目前没有新的投资计划。台积电8月在德国德累斯顿启动了一个价值100亿欧元的芯片制造厂建设项目,这是其在欧盟的首个工厂。项目资金大约一半将由当地政府补贴,计划于 2027 年底投产。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
据台湾官员透露,台积电正计划在欧洲建立更多工厂,重点关注人工智能芯片市场,以扩大其全球业务版图。台湾国家科学及技术委员会主任委员吴诚文表示:“台积电已经开始在德国德累斯顿建设第一座晶圆厂,并计划在未来针对不同的市场领域建设几座晶圆厂。”台积电称,该公司仍将重点关注当前的全球扩张项目,目前没有新的投资计划。台积电8月在德国德累斯顿启动了一个价值100亿欧元的芯片制造厂建设项目,这是其在欧盟的首个工厂。项目资金大约一半将由当地政府补贴,计划于 2027 年底投产。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
苹果公司推出全新的智能家居战略
在落后亚马逊和谷歌之后,苹果公司终于准备争夺智能家居市场。为了实现该任务,苹果公司将重点关注家居生态系统领域,组建了一个新的团队,并从已取消的汽车项目中调来了部分工程师。该计划由三个关键部分驱动:人工智能、显示屏和软件。该战略的第一部分包括 Apple Intelligence,将用于增强家庭自动化。人工智能还将用于对应用、设备和媒体进行精确控制。该战略的第二部分涉及智能家居显示屏,桌面显示屏设备将使用人工智能来了解其周围环境,以便能够感知谁在看屏幕、人们在做什么以及谁在说话。至于该战略的最后一部分,苹果公司正在打造一款名为 homeOS 的新智能家居操作系统,该系统基于 Apple TV 的 tvOS。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
在落后亚马逊和谷歌之后,苹果公司终于准备争夺智能家居市场。为了实现该任务,苹果公司将重点关注家居生态系统领域,组建了一个新的团队,并从已取消的汽车项目中调来了部分工程师。该计划由三个关键部分驱动:人工智能、显示屏和软件。该战略的第一部分包括 Apple Intelligence,将用于增强家庭自动化。人工智能还将用于对应用、设备和媒体进行精确控制。该战略的第二部分涉及智能家居显示屏,桌面显示屏设备将使用人工智能来了解其周围环境,以便能够感知谁在看屏幕、人们在做什么以及谁在说话。至于该战略的最后一部分,苹果公司正在打造一款名为 homeOS 的新智能家居操作系统,该系统基于 Apple TV 的 tvOS。
—— 彭博社
via 风向旗参考快讯 - Telegram Channel
志愿者想要保护维基百科免遭 AI 生成内容的入侵
2024-10-12 12:48 by 隐身人
一群志愿者编辑成立了 WikiProject AI Cleanup 项目,旨在保护世界最大的在线百科全书维基百科免遭低质量 AI 生成内容的入侵。自 2022 年以来,ChatGPT 之类的大模型成为写作的方便工具,但大模型不能正确引用来源,会经常捏造来源。该项目通过识别 AI 生成内容,验证内容是否遵循维基百科的政策,删除不符合要求的内容;通过识别 AI 生成图像,确保使用恰当。WikiProject AI Cleanup 通过搜索 ChatGPT 常用短语去寻找 AI 生成内容,比如“As of my last knowledge update in January 2022”——即大模型训练数据库最近更新的时间。
https://news.slashdot.org/story/24/10/11/1554202/the-editors-protecting-wikipedia-from-ai-hoaxes
https://en.wikipedia.org/wiki/Wikipedia:WikiProject_AI_Cleanup
#维基百科
via Solidot - Telegram Channel
2024-10-12 12:48 by 隐身人
一群志愿者编辑成立了 WikiProject AI Cleanup 项目,旨在保护世界最大的在线百科全书维基百科免遭低质量 AI 生成内容的入侵。自 2022 年以来,ChatGPT 之类的大模型成为写作的方便工具,但大模型不能正确引用来源,会经常捏造来源。该项目通过识别 AI 生成内容,验证内容是否遵循维基百科的政策,删除不符合要求的内容;通过识别 AI 生成图像,确保使用恰当。WikiProject AI Cleanup 通过搜索 ChatGPT 常用短语去寻找 AI 生成内容,比如“As of my last knowledge update in January 2022”——即大模型训练数据库最近更新的时间。
https://news.slashdot.org/story/24/10/11/1554202/the-editors-protecting-wikipedia-from-ai-hoaxes
https://en.wikipedia.org/wiki/Wikipedia:WikiProject_AI_Cleanup
#维基百科
via Solidot - Telegram Channel
苹果研究员质疑大语言模型(LLM)的推理能力,认为其仅是复杂的模式匹配
苹果研究员Mehrdad Farajtabar等人发表的论文对大型语言模型(LLM)的推理能力提出质疑,认为LLM所谓的“推理”能力实际上只是复杂的模式匹配,并非真正的逻辑推理。研究团队开发了GSM-Symbolic工具,基于GSM8K测试集生成符号模板,发现目前的LLM如Llama、Phi、Gemma、Mistral 等开源模型,以及 GPT-4o 和 o1 系列等闭源模型对专有名词和数字的更改非常敏感,显示出对数学概念理解的不足。实验结果显示,即使在参数和数据量增加的情况下,LLM的推理能力并没有实质性提升,只是成为了“更好的模式匹配器”。
arxiv
☘️ 关注频道 @ZaiHuapd
📮 热点投稿 @ZaiHuabot
via 科技圈🎗在花频道📮 - Telegram Channel
苹果研究员Mehrdad Farajtabar等人发表的论文对大型语言模型(LLM)的推理能力提出质疑,认为LLM所谓的“推理”能力实际上只是复杂的模式匹配,并非真正的逻辑推理。研究团队开发了GSM-Symbolic工具,基于GSM8K测试集生成符号模板,发现目前的LLM如Llama、Phi、Gemma、Mistral 等开源模型,以及 GPT-4o 和 o1 系列等闭源模型对专有名词和数字的更改非常敏感,显示出对数学概念理解的不足。实验结果显示,即使在参数和数据量增加的情况下,LLM的推理能力并没有实质性提升,只是成为了“更好的模式匹配器”。
arxiv
☘️ 关注频道 @ZaiHuapd
📮 热点投稿 @ZaiHuabot
via 科技圈🎗在花频道📮 - Telegram Channel
特斯拉本周在其官方网站发布了一则招聘启事,暗示公司正计划内部生产磷酸铁锂电池(LFP)。这一举措可能标志着特斯拉在电池制造领域的进一步垂直整合。
该职位位于加利福尼亚州帕洛阿尔托,是特斯拉人工智能和工程总部所在地。职位描述中指出,应聘者将负责领导跨职能团队对磷酸铁锂阴极材料进行验证,开发新的材料和电化学测试,以加快认证时间,并将团队在材料和电化学数据解释方面的专业知识提升到一个新的水平。
环球网
☘️ 关注频道 @ZaiHuapd
📮 热点投稿 @ZaiHuabot
via 科技圈🎗在花频道📮 - Telegram Channel
中国人工智能服务注册用户超过6亿
中国工信部12日表示,截至目前,中国生成式人工智能服务大模型的注册用户超过6亿。工信部总工程师赵志国说,中国人工智能核心产业的规模在不断提升,企业数量超过了4500家。完成备案并上线为公众提供服务的生成式人工智能服务大模型近200个,注册用户超过6亿。赵志国称,中国人工智能领域专利申请量和授权量居全球前列。未来将提升算力设施的供给能力,加快构建全国一体化的算力体系,稳固提升智能算力的占比。中国移动12日联合电子标准院及16家重点企业共同发布《通用大模型评测标准》,为企业遴选优质大模型提供参考依据。
—— 央视新闻
via 风向旗参考快讯 - Telegram Channel
中国工信部12日表示,截至目前,中国生成式人工智能服务大模型的注册用户超过6亿。工信部总工程师赵志国说,中国人工智能核心产业的规模在不断提升,企业数量超过了4500家。完成备案并上线为公众提供服务的生成式人工智能服务大模型近200个,注册用户超过6亿。赵志国称,中国人工智能领域专利申请量和授权量居全球前列。未来将提升算力设施的供给能力,加快构建全国一体化的算力体系,稳固提升智能算力的占比。中国移动12日联合电子标准院及16家重点企业共同发布《通用大模型评测标准》,为企业遴选优质大模型提供参考依据。
—— 央视新闻
via 风向旗参考快讯 - Telegram Channel
男子通过苹果 AI 的短信总结获悉分手的消息
2024-10-12 06:25 by 智能侵略
纽约程序员 Nick Spreen 周三通过 iPhone 15 Pro AI 功能 Apple Intelligence 测试版提供的短信总结功能获悉了分手的消息。他在社交媒体上分享了这一消息,AI 总结了他女友发来的多条短信,宣布了分手的消息表示想要从公寓里拿回属于自己的物品。苹果是在今年 6 月宣布了 Apple Intelligence,目前正在进行公测。Spreen 在自己的 iPhone 手机上运行了测试版。它类似于一个精简版的 ChatGPT,通过读取用户收到的短信提供一个总结版本。
https://entertainment.slashdot.org/story/24/10/10/228207/man-learns-hes-being-dumped-via-dystopian-ai-summary-of-texts
#Idle
via Solidot - Telegram Channel
2024-10-12 06:25 by 智能侵略
纽约程序员 Nick Spreen 周三通过 iPhone 15 Pro AI 功能 Apple Intelligence 测试版提供的短信总结功能获悉了分手的消息。他在社交媒体上分享了这一消息,AI 总结了他女友发来的多条短信,宣布了分手的消息表示想要从公寓里拿回属于自己的物品。苹果是在今年 6 月宣布了 Apple Intelligence,目前正在进行公测。Spreen 在自己的 iPhone 手机上运行了测试版。它类似于一个精简版的 ChatGPT,通过读取用户收到的短信提供一个总结版本。
https://entertainment.slashdot.org/story/24/10/10/228207/man-learns-hes-being-dumped-via-dystopian-ai-summary-of-texts
#Idle
via Solidot - Telegram Channel
苹果研究员发现大模型不能形式推理
2024-10-12 05:32 by 迷失的世界
六名苹果 AI 研究员(其中一名是实习生)在预印本平台 arxiv 上发表了一篇论文《GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models》,他们发现大模型不能形式推理。研究人员称,GSM8K 基准测试被广泛用于评估大模型在小学水平问题上的数学推理能力。过去几年,大模型在 GSM8K 上的表现有显著提高,但它们的数学推理能力是否真的提升了?研究人员利用符号模板创建了一个改进基准测试 GSM-Symbolic,能对大模型的推理能力进行更可控的评估。结果显示,大模型并不具有真正的逻辑推理能力,仅仅改变问题的某个数值或者增加一条子句,大模型的表现就会显著下降。
https://arxiv.org/pdf/2410.05229
#人工智能
via Solidot - Telegram Channel
2024-10-12 05:32 by 迷失的世界
六名苹果 AI 研究员(其中一名是实习生)在预印本平台 arxiv 上发表了一篇论文《GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models》,他们发现大模型不能形式推理。研究人员称,GSM8K 基准测试被广泛用于评估大模型在小学水平问题上的数学推理能力。过去几年,大模型在 GSM8K 上的表现有显著提高,但它们的数学推理能力是否真的提升了?研究人员利用符号模板创建了一个改进基准测试 GSM-Symbolic,能对大模型的推理能力进行更可控的评估。结果显示,大模型并不具有真正的逻辑推理能力,仅仅改变问题的某个数值或者增加一条子句,大模型的表现就会显著下降。
https://arxiv.org/pdf/2410.05229
#人工智能
via Solidot - Telegram Channel
苹果研究人员表示AI模型不具有推理能力
苹果公司的六位人工智能研究人员刚刚发表了一篇关于大语言模型LLM的极好文章,他们勇于挑战主流模式。其中有一段很关键:“我们在语言模型中没有发现形式推理的证据 .... 它们的行为可以用复杂的模式匹配来更好地解释。事实上,这种模式匹配非常脆弱,改变名称可以使结果改变大约10%!”(一句话)改变一个词以不相关的方式重复两遍或添加一些不相关的信息可能会给你不同的答案。
LLM 缺乏足够抽象和正规推理的另一个表现是,问题越大,性能往往越差。在解决小问题时性能还可以,但很快就会下降。我们可以在整数运算中看到同样的情况。无论是旧模型还是新模型,在越来越大的乘法运算问题上,我们都能多次观察到运算速度下降的现象。埃隆·马斯克的自动驾驶出租车可能也会遭遇类似的问题:它们在最常见的情况下可能能够安全运行,但在某些情况下也可能难以进行足够的抽象推理。
—— Marcus on AI
via 风向旗参考快讯 - Telegram Channel
苹果公司的六位人工智能研究人员刚刚发表了一篇关于大语言模型LLM的极好文章,他们勇于挑战主流模式。其中有一段很关键:“我们在语言模型中没有发现形式推理的证据 .... 它们的行为可以用复杂的模式匹配来更好地解释。事实上,这种模式匹配非常脆弱,改变名称可以使结果改变大约10%!”(一句话)改变一个词以不相关的方式重复两遍或添加一些不相关的信息可能会给你不同的答案。
LLM 缺乏足够抽象和正规推理的另一个表现是,问题越大,性能往往越差。在解决小问题时性能还可以,但很快就会下降。我们可以在整数运算中看到同样的情况。无论是旧模型还是新模型,在越来越大的乘法运算问题上,我们都能多次观察到运算速度下降的现象。埃隆·马斯克的自动驾驶出租车可能也会遭遇类似的问题:它们在最常见的情况下可能能够安全运行,但在某些情况下也可能难以进行足够的抽象推理。
—— Marcus on AI
via 风向旗参考快讯 - Telegram Channel