OpenAI状态页通知 | 汇集全网ChatGPT/AI新闻
🔖标签:#AI #ChatGPT
🌐免费AI聊天: https://free.netfly.top
🪜API中转: https://api.oaibest.com (OpenAI/GPTs/高级语音/Claude/联网/文件分析/MJ画图)
📎服务发布页: https://link3.cc/gpt123
Buy ads: https://telega.io/c/AI_News_CN
🔖标签:#AI #ChatGPT
🌐免费AI聊天: https://free.netfly.top
🪜API中转: https://api.oaibest.com (OpenAI/GPTs/高级语音/Claude/联网/文件分析/MJ画图)
📎服务发布页: https://link3.cc/gpt123
Buy ads: https://telega.io/c/AI_News_CN
苹果研究员发现大模型不能形式推理
2024-10-12 05:32 by 迷失的世界
六名苹果 AI 研究员(其中一名是实习生)在预印本平台 arxiv 上发表了一篇论文《GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models》,他们发现大模型不能形式推理。研究人员称,GSM8K 基准测试被广泛用于评估大模型在小学水平问题上的数学推理能力。过去几年,大模型在 GSM8K 上的表现有显著提高,但它们的数学推理能力是否真的提升了?研究人员利用符号模板创建了一个改进基准测试 GSM-Symbolic,能对大模型的推理能力进行更可控的评估。结果显示,大模型并不具有真正的逻辑推理能力,仅仅改变问题的某个数值或者增加一条子句,大模型的表现就会显著下降。
https://arxiv.org/pdf/2410.05229
#人工智能
via Solidot - Telegram Channel
2024-10-12 05:32 by 迷失的世界
六名苹果 AI 研究员(其中一名是实习生)在预印本平台 arxiv 上发表了一篇论文《GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models》,他们发现大模型不能形式推理。研究人员称,GSM8K 基准测试被广泛用于评估大模型在小学水平问题上的数学推理能力。过去几年,大模型在 GSM8K 上的表现有显著提高,但它们的数学推理能力是否真的提升了?研究人员利用符号模板创建了一个改进基准测试 GSM-Symbolic,能对大模型的推理能力进行更可控的评估。结果显示,大模型并不具有真正的逻辑推理能力,仅仅改变问题的某个数值或者增加一条子句,大模型的表现就会显著下降。
https://arxiv.org/pdf/2410.05229
#人工智能
via Solidot - Telegram Channel
苹果研究人员表示AI模型不具有推理能力
苹果公司的六位人工智能研究人员刚刚发表了一篇关于大语言模型LLM的极好文章,他们勇于挑战主流模式。其中有一段很关键:“我们在语言模型中没有发现形式推理的证据 .... 它们的行为可以用复杂的模式匹配来更好地解释。事实上,这种模式匹配非常脆弱,改变名称可以使结果改变大约10%!”(一句话)改变一个词以不相关的方式重复两遍或添加一些不相关的信息可能会给你不同的答案。
LLM 缺乏足够抽象和正规推理的另一个表现是,问题越大,性能往往越差。在解决小问题时性能还可以,但很快就会下降。我们可以在整数运算中看到同样的情况。无论是旧模型还是新模型,在越来越大的乘法运算问题上,我们都能多次观察到运算速度下降的现象。埃隆·马斯克的自动驾驶出租车可能也会遭遇类似的问题:它们在最常见的情况下可能能够安全运行,但在某些情况下也可能难以进行足够的抽象推理。
—— Marcus on AI
via 风向旗参考快讯 - Telegram Channel
苹果公司的六位人工智能研究人员刚刚发表了一篇关于大语言模型LLM的极好文章,他们勇于挑战主流模式。其中有一段很关键:“我们在语言模型中没有发现形式推理的证据 .... 它们的行为可以用复杂的模式匹配来更好地解释。事实上,这种模式匹配非常脆弱,改变名称可以使结果改变大约10%!”(一句话)改变一个词以不相关的方式重复两遍或添加一些不相关的信息可能会给你不同的答案。
LLM 缺乏足够抽象和正规推理的另一个表现是,问题越大,性能往往越差。在解决小问题时性能还可以,但很快就会下降。我们可以在整数运算中看到同样的情况。无论是旧模型还是新模型,在越来越大的乘法运算问题上,我们都能多次观察到运算速度下降的现象。埃隆·马斯克的自动驾驶出租车可能也会遭遇类似的问题:它们在最常见的情况下可能能够安全运行,但在某些情况下也可能难以进行足够的抽象推理。
—— Marcus on AI
via 风向旗参考快讯 - Telegram Channel
Google似乎要让Android系统可以直接运行Linux软件
尽管 Android 系统本身就是基于 Linux 内核开发的,不过默认情况下用户无法直接在 Android 上运行 Linux 软件,但谷歌的 ChromeOS 系统此前就已经实现了兼容 Linux 软件。
现在谷歌似乎也要将这种改变带到 Android 系统上,让 Android 系统也可以无需借助第三方软件,直接运行 Linux 软件。
据 Android Authority 发布的消息,从几周前开始,谷歌工程师开始开发一款适用于 Android 系统的新终端应用,该应用是 Android 虚拟化框架 (AVF) 的一部分。
这个终端应用包含一个通过本地 IP 地址连接到 Linux 虚拟机的 WebView,用户则可以从 Android 系统 (宿主机) 运行命令,本质上这相当于是在 Android 系统里嵌套虚拟化了一个 Linux 运行环境。
在最初的开发中,用户需要通过 shell 命令手动启动终端应用,接着还需要配置 Linux VM,不过现在谷歌正在继续进行改进,将这个终端应用直接集成到 Android 中,将其转变为在 VM 虚拟机中运行 Linux 发行版的一体化应用。
后续完成开发时用户可以在开发者选项里启动这个新的 Linux 终端,而在启动后还需要提供 Debian 映像用于运行 Linux 软件,后续谷歌应该也会将这些工作全部自动化。
最终这个新的终端软件应该可以实现集下载、配置、运行和与 Debian VM 实例交互的一体化应用,让用户可以非常轻松地在 Android 系统内运行 Linux 软件。
YouTube视频演示
via ZiRCON
🗒 标签: #Google #Linux
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
via Yummy 😋 - Telegram Channel
Invalid media:
image
image
尽管 Android 系统本身就是基于 Linux 内核开发的,不过默认情况下用户无法直接在 Android 上运行 Linux 软件,但谷歌的 ChromeOS 系统此前就已经实现了兼容 Linux 软件。
现在谷歌似乎也要将这种改变带到 Android 系统上,让 Android 系统也可以无需借助第三方软件,直接运行 Linux 软件。
据 Android Authority 发布的消息,从几周前开始,谷歌工程师开始开发一款适用于 Android 系统的新终端应用,该应用是 Android 虚拟化框架 (AVF) 的一部分。
这个终端应用包含一个通过本地 IP 地址连接到 Linux 虚拟机的 WebView,用户则可以从 Android 系统 (宿主机) 运行命令,本质上这相当于是在 Android 系统里嵌套虚拟化了一个 Linux 运行环境。
在最初的开发中,用户需要通过 shell 命令手动启动终端应用,接着还需要配置 Linux VM,不过现在谷歌正在继续进行改进,将这个终端应用直接集成到 Android 中,将其转变为在 VM 虚拟机中运行 Linux 发行版的一体化应用。
后续完成开发时用户可以在开发者选项里启动这个新的 Linux 终端,而在启动后还需要提供 Debian 映像用于运行 Linux 软件,后续谷歌应该也会将这些工作全部自动化。
最终这个新的终端软件应该可以实现集下载、配置、运行和与 Debian VM 实例交互的一体化应用,让用户可以非常轻松地在 Android 系统内运行 Linux 软件。
YouTube视频演示
via ZiRCON
🗒 标签: #Google #Linux
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot
via Yummy 😋 - Telegram Channel
Invalid media:
image
image
撸豆包羊毛了,通过上面链接注册MarsCode,VScode安装,完成首次AI对话送10个币;
再邀请自己另一个手机号注册,cursor里面安装对话再送10个币。当然邀请别人也可以,第二天审核后喜提20元京东E卡。
OpenAI 推出人工智能工程基准测试 先给自家 o1-preview 最高分
OpenAI创建了一个名为MLE-bench的新基准,以评估人工智能代理开发机器学习解决方案的程度。MLE-bench 专注于两个关键领域:选择代表当前 ML 开发中具有挑战性的任务,并将 AI 结果与人类表现进行比较。该基准包括75个Kaggle竞赛项目,旨在衡量机器学习工程中自主人工智能系统的进展。
在最初的实验中,带有AIDE框架的o1-preview模型取得了最佳效果。它在16.9%的比赛中至少获得了一枚铜牌。每次竞赛时更长的处理时间能产出更好的结果,而额外的GPU功率没有产生重大影响。
The Decoder
☘️ 关注频道 @ZaiHuapd
📮 热点投稿 @ZaiHuabot
via 科技圈🎗在花频道📮 - Telegram Channel
OpenAI创建了一个名为MLE-bench的新基准,以评估人工智能代理开发机器学习解决方案的程度。MLE-bench 专注于两个关键领域:选择代表当前 ML 开发中具有挑战性的任务,并将 AI 结果与人类表现进行比较。该基准包括75个Kaggle竞赛项目,旨在衡量机器学习工程中自主人工智能系统的进展。
在最初的实验中,带有AIDE框架的o1-preview模型取得了最佳效果。它在16.9%的比赛中至少获得了一枚铜牌。每次竞赛时更长的处理时间能产出更好的结果,而额外的GPU功率没有产生重大影响。
The Decoder
☘️ 关注频道 @ZaiHuapd
📮 热点投稿 @ZaiHuabot
via 科技圈🎗在花频道📮 - Telegram Channel
维基百科编辑团队开始清理AI虚假信息
维基百科编辑团队成立了一个名为WikiProject AI Cleanup的项目,用于解决维基百科上越来越多的未经核实、质量低下的AI生成内容问题。该团队的目标是保护世界上最大的信息库免受生成式AI的误导性影响。
维基百科编辑团队使用与其他人在科学期刊和谷歌图书中发现AI生成内容相同的方法来识别维基百科上的AI生成内容,例如搜索ChatGPT常用的短语。例如,2023年11月,维基百科上的一篇关于切斯特心理健康中心的文章中包含了短语“As of my last knowledge update in January 2022”,这表明该文章是由AI生成的。
Slashdot
☘️ 关注频道 @ZaiHuapd
📮 热点投稿 @ZaiHuabot
via 科技圈🎗在花频道📮 - Telegram Channel
维基百科编辑团队成立了一个名为WikiProject AI Cleanup的项目,用于解决维基百科上越来越多的未经核实、质量低下的AI生成内容问题。该团队的目标是保护世界上最大的信息库免受生成式AI的误导性影响。
维基百科编辑团队使用与其他人在科学期刊和谷歌图书中发现AI生成内容相同的方法来识别维基百科上的AI生成内容,例如搜索ChatGPT常用的短语。例如,2023年11月,维基百科上的一篇关于切斯特心理健康中心的文章中包含了短语“As of my last knowledge update in January 2022”,这表明该文章是由AI生成的。
Slashdot
☘️ 关注频道 @ZaiHuapd
📮 热点投稿 @ZaiHuabot
via 科技圈🎗在花频道📮 - Telegram Channel
导航站收录更新通知!
#AI·产品 #AI新时代
站点名称: Humanize AI - Free AI Humanizer & Get 100% Human Score
Logo: https://humanizeai.tools/favicon.ico
链接: https://humanizeai.tools/
描述: Humanize AI是功能最强大的免费在线工具,可将 AI 文本人性化。也被称为 AI Humanizer 或 AI 到人类文本转换器。它将使用人工智能 (AI) 编写器生成的内容或文本重写为类似人类的文本,没有机器人的语气
前往导航: www.noisedh.cn 或 www.noisedh.link
via 🎉 Efficiency资源干货全收录 - Telegram Channel
#AI·产品 #AI新时代
站点名称: Humanize AI - Free AI Humanizer & Get 100% Human Score
Logo: https://humanizeai.tools/favicon.ico
链接: https://humanizeai.tools/
描述: Humanize AI是功能最强大的免费在线工具,可将 AI 文本人性化。也被称为 AI Humanizer 或 AI 到人类文本转换器。它将使用人工智能 (AI) 编写器生成的内容或文本重写为类似人类的文本,没有机器人的语气
前往导航: www.noisedh.cn 或 www.noisedh.link
via 🎉 Efficiency资源干货全收录 - Telegram Channel