ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折支持Deepseek、OpenAI（o3/GPTs/Sora/实时语音）、Claude、Gemini、Midjourney、文件上传
Buy ads: https://telega.io/c/AI_News_CN

13:25 · 2024年10月13日 · 周日

苹果研究员发现大模型不能形式推理

2024-10-12 05:32 by 迷失的世界

六名苹果 AI 研究员(其中一名是实习生)在预印本平台 arxiv 上发表了一篇论文《GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models》，他们发现大模型不能形式推理。研究人员称，GSM8K 基准测试被广泛用于评估大模型在小学水平问题上的数学推理能力。过去几年，大模型在 GSM8K 上的表现有显著提高，但它们的数学推理能力是否真的提升了？研究人员利用符号模板创建了一个改进基准测试 GSM-Symbolic，能对大模型的推理能力进行更可控的评估。结果显示，大模型并不具有真正的逻辑推理能力，仅仅改变问题的某个数值或者增加一条子句，大模型的表现就会显著下降。

https://arxiv.org/pdf/2410.05229

#人工智能

via Solidot - Telegram Channel

02:32 · 2024年10月13日 · 周日

苹果研究人员表示AI模型不具有推理能力

苹果公司的六位人工智能研究人员刚刚发表了一篇关于大语言模型LLM的极好文章，他们勇于挑战主流模式。其中有一段很关键：“我们在语言模型中没有发现形式推理的证据 .... 它们的行为可以用复杂的模式匹配来更好地解释。事实上，这种模式匹配非常脆弱，改变名称可以使结果改变大约10%！”（一句话）改变一个词以不相关的方式重复两遍或添加一些不相关的信息可能会给你不同的答案。

LLM 缺乏足够抽象和正规推理的另一个表现是，问题越大，性能往往越差。在解决小问题时性能还可以，但很快就会下降。我们可以在整数运算中看到同样的情况。无论是旧模型还是新模型，在越来越大的乘法运算问题上，我们都能多次观察到运算速度下降的现象。埃隆·马斯克的自动驾驶出租车可能也会遭遇类似的问题：它们在最常见的情况下可能能够安全运行，但在某些情况下也可能难以进行足够的抽象推理。

—— Marcus on AI

via 风向旗参考快讯 - Telegram Channel

01:32 · 2024年10月13日 · 周日

Google似乎要让Android系统可以直接运行Linux软件

尽管 Android 系统本身就是基于 Linux 内核开发的，不过默认情况下用户无法直接在 Android 上运行 Linux 软件，但谷歌的 ChromeOS 系统此前就已经实现了兼容 Linux 软件。

现在谷歌似乎也要将这种改变带到 Android 系统上，让 Android 系统也可以无需借助第三方软件，直接运行 Linux 软件。

据 Android Authority 发布的消息，从几周前开始，谷歌工程师开始开发一款适用于 Android 系统的新终端应用，该应用是 Android 虚拟化框架 (AVF) 的一部分。

这个终端应用包含一个通过本地 IP 地址连接到 Linux 虚拟机的 WebView，用户则可以从 Android 系统 (宿主机) 运行命令，本质上这相当于是在 Android 系统里嵌套虚拟化了一个 Linux 运行环境。

在最初的开发中，用户需要通过 shell 命令手动启动终端应用，接着还需要配置 Linux VM，不过现在谷歌正在继续进行改进，将这个终端应用直接集成到 Android 中，将其转变为在 VM 虚拟机中运行 Linux 发行版的一体化应用。

后续完成开发时用户可以在开发者选项里启动这个新的 Linux 终端，而在启动后还需要提供 Debian 映像用于运行 Linux 软件，后续谷歌应该也会将这些工作全部自动化。

最终这个新的终端软件应该可以实现集下载、配置、运行和与 Debian VM 实例交互的一体化应用，让用户可以非常轻松地在 Android 系统内运行 Linux 软件。

YouTube视频演示

via ZiRCON

🗒 标签: #Google #Linux
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot

via Yummy 😋 - Telegram Channel

Invalid media:
image
image

21:52 · 2024年10月12日 · 周六

我是豆包MarsCode合伙人，给你分享一个免费的智能编程助手，邀你用AI助力编码，快来注册使用吧，送万元现金和京东卡！https://www.marscode.cn/events/s/iBsCchUn/

撸豆包羊毛了，通过上面链接注册MarsCode，VScode安装，完成首次AI对话送10个币；

再邀请自己另一个手机号注册，cursor里面安装对话再送10个币。当然邀请别人也可以，第二天审核后喜提20元京东E卡。

21:33 · 2024年10月12日 · 周六

OpenAI 推出人工智能工程基准测试先给自家 o1-preview 最高分

OpenAI创建了一个名为MLE-bench的新基准，以评估人工智能代理开发机器学习解决方案的程度。MLE-bench 专注于两个关键领域：选择代表当前 ML 开发中具有挑战性的任务，并将 AI 结果与人类表现进行比较。该基准包括75个Kaggle竞赛项目，旨在衡量机器学习工程中自主人工智能系统的进展。

在最初的实验中，带有AIDE框架的o1-preview模型取得了最佳效果。它在16.9%的比赛中至少获得了一枚铜牌。每次竞赛时更长的处理时间能产出更好的结果，而额外的GPU功率没有产生重大影响。

The Decoder

☘️ 关注频道 @ZaiHuapd
📮 热点投稿 @ZaiHuabot

via 科技圈🎗在花频道📮 - Telegram Channel

18:11 · 2024年10月12日 · 周六

Anthropic CEO ：5到10年内 AI将助力人类扫除几乎所有疾病人类寿命有望翻倍达到150岁

via XiaoHu.AI学院 (author: 小互)

XiaoHu.AI学院

Anthropic CEO ：5到10年内 AI将助力人类扫除几乎所有疾病人类寿命有望翻倍达到150岁

Anthropic 的 CEO Dari

10:41 · 2024年10月12日 · 周六

OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作

via XiaoHu.AI学院 (author: 小互)

Telegraph

OpenAI 开源多智能体设计和管理工具OpenAI Swarm 可让多个智能体协同工作

OpenAI Swarm 是一个由 OpenAI Solutions 团队开发的实验性框架，专门用于构建、编排和部署多智能体系统（multi-agent systems）。它旨在为开发人员提供一个轻量、可控且易于测试的工具集，帮助他们设计和管理多个相互协作的AI代理（Agent），并让多个智能体协同工作，以便处理复杂的任务和工作流。这个框架使用 Python 编写，依赖 OpenAI 的 Chat Completions API 进行对话管理和执行。

03:42 · 2024年10月12日 · 周六

维基百科编辑团队开始清理AI虚假信息

维基百科编辑团队成立了一个名为WikiProject AI Cleanup的项目，用于解决维基百科上越来越多的未经核实、质量低下的AI生成内容问题。该团队的目标是保护世界上最大的信息库免受生成式AI的误导性影响。

维基百科编辑团队使用与其他人在科学期刊和谷歌图书中发现AI生成内容相同的方法来识别维基百科上的AI生成内容，例如搜索ChatGPT常用的短语。例如，2023年11月，维基百科上的一篇关于切斯特心理健康中心的文章中包含了短语“As of my last knowledge update in January 2022”，这表明该文章是由AI生成的。

Slashdot

☘️ 关注频道 @ZaiHuapd
📮 热点投稿 @ZaiHuabot

via 科技圈🎗在花频道📮 - Telegram Channel

20:42 · 2024年10月11日 · 周五

导航站收录更新通知！
#AI·产品 #AI新时代
站点名称: Humanize AI - Free AI Humanizer & Get 100% Human Score
Logo: https://humanizeai.tools/favicon.ico
链接: https://humanizeai.tools/
描述: Humanize AI是功能最强大的免费在线工具，可将 AI 文本人性化。也被称为 AI Humanizer 或 AI 到人类文本转换器。它将使用人工智能 (AI) 编写器生成的内容或文本重写为类似人类的文本，没有机器人的语气
前往导航: www.noisedh.cn 或 www.noisedh.link

via 🎉 Efficiency资源干货全收录 - Telegram Channel

19:20 · 2024年10月11日 · 周五

特斯拉We Robot 发布会全纪录：完全无人驾驶出租车、Optimus 机器人、Robovan（机器人巴士）

特斯拉在洛杉矶”We, Robot”活动上发布了其全新Cybercab，这款车类似于更小、更流线型的双座版Cybertruck。

这款被称为“机器人出租车”（robotaxi）的车辆是专为自动驾驶设计的，车内没有方向盘和任何踏板，它的设计充满未来感，车门像蝴蝶翼一样向上开启，车内空间仅够两名乘客使用。

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.
Login if you have purchased

加入会员
加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。
开通会员

via XiaoHu.AI学院 (author: 小互)

Invalid media:
video
video
video
video
video

2:38

Media is too big

VIEW IN TELEGRAM

18:13 · 2024年10月11日 · 周五

微软推出 Copliot for WhatsApp 机器人

微软在 WhatsApp 上推出了 Copilot 聊天机器人。目前已经正式上线。聊天机器人可以回答用户的问题、分析图像并生成图片。用户可以使用 WhatsApp 移动应用扫描二维码、使用此 [短链接] 、或者添加联系人 [+1 877-224-1042] 加入与聊天机器人的对话。要激活，用户需要发送消息“Hi Copilot”并接受使用条款和隐私声明。

—— 微软

via 风向旗参考快讯 - Telegram Channel

Before

After