ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折支持Deepseek、OpenAI（o3/GPTs/Sora/实时语音）、Claude、Gemini、Midjourney、文件上传
Buy ads: https://telega.io/c/AI_News_CN

16:59 · 2024年10月23日 · 周三

ChatGPT / AI新闻聚合

Video

16:59 · 2024年10月23日 · 周三

ChatGPT / AI新闻聚合

Genmo 推出目前全球最大的开源视频生成模型 Mochi 1 Genmo 推出最新开源视频生成模型 Mochi 1。 ● Mochi 1 采用了Asymmetric Diffusion Transformer（AsymmDiT）架构，是迄今为止最大的开源视频生成模型，具备10亿参数。 ● 该模型可同时处理文本和视频信号，拥有更强的视觉推理能力，同时优化了内存需求。功能特点： 1. 高保真动作生成 ● 动作流畅、自然：生成的视频帧率达到30帧/秒，持续时间最长可达5.4秒，具备高时间一致性，确保动作连贯且自然。…

16:59 · 2024年10月23日 · 周三

Genmo 推出目前全球最大的开源视频生成模型 Mochi 1

Genmo 推出最新开源视频生成模型 Mochi 1。

● Mochi 1 采用了Asymmetric Diffusion Transformer（AsymmDiT）架构，是迄今为止最大的开源视频生成模型，具备10亿参数。
● 该模型可同时处理文本和视频信号，拥有更强的视觉推理能力，同时优化了内存需求。

功能特点：

1. 高保真动作生成

● 动作流畅、自然：生成的视频帧率达到30帧/秒，持续时间最长可达5.4秒，具备高时间一致性，确保动作连贯且自然。
● 逼真的物理效果：模型在生成流体动态、毛发模拟和人类行为时，遵循物理法则，生成结果更加自然逼真。
● 突破“恐怖谷”问题：人类角色的动作和表情流畅连贯，细节丰富，显著提升了视频的真实感和自然度。

2. 强大的文本提示响应

● 精确的提示对齐：Mochi 1 能根据用户的文本指令，生成与描述高度一致的场景、角色和动作。
● 多模态融合：模型在处理视觉和文本提示时使用多模态自注意力机制，实现文本和视频的协同处理，使得生成结果符合用户预期。

衡量生成的视频遵循所提供的文本指令的准确程度，确保高度保真用户意图

评估运动平滑度和空间真实感，确保生成的视频流畅且具有视觉吸引力。

3.实时生成与高效推理

● 实时视频生成：在推理阶段，Mochi 1 通过高效的内存管理和并行计算策略，实现了快速的视频生成和低延迟响应。
● 适用于多种应用场景：可用于视频创作、娱乐、虚拟环境训练、机器人合成数据等领域。

技术架构

Mochi 1 的模型架构是基于 Asymmetric Diffusion Transformer（AsymmDiT）

Support authors and subscribe to content

This is premium stuff. Subscribe to read the entire article.
Login if you have purchased

加入会员
加入会员查看更多会员内容和教程。
超过1000+的会员内容，每天更新。
开通会员

via XiaoHu.AI学院 (author: 小互)

15:53 · 2024年10月23日 · 周三

ChatGPT / AI新闻聚合

新版Claude 3.5 Sonnet将可进行电脑操作 Haiku也将升级到3.5 今天，Anthropic宣布了升级版 Claude 3.5 Sonnet，以及新模型Claude 3.5 Haiku。新版 Claude 3.5 Sonnet 在各方面都比前代有显著提升，尤其是在编码方面——这一领域它本来就处于领先地位。Claude 3.5 Haiku 在许多评估中与 Claude 3 Opus 性能相当，且价格不变。新版的 Claude 3.5 Sonnet 现已面向所有用户开放。 Claude 3.5…

api.oaibest.com 已支持claude-3-5-sonnet-20241022。

14:06 · 2024年10月23日 · 周三

OpenAI满血版o1剧透：数学代码能力提升

OpenAI即将推出的满血版o1模型在数学和编码能力上表现出色，远超o1-preview和GPT-4o。目前，满血版o1正在进行测试评估，未来还将增加网页浏览、文件和图像上传等功能。

o1系列分为满血版o1、o1-preview和o1-mini，分别侧重于深度思考、预览功能和速度优化。尽管满血版o1整体表现优异，但在某些高难度任务上，o1-preview反而表现更好。

量子位

📮 热点投稿 @ZaiHuabot
京东淘宝无门槛红包 m.fanli.me

via 科技圈🎗在花频道📮 - Telegram Channel

13:58 · 2024年10月23日 · 周三

Anthropic 的新人工智能模型可操控用户电脑

初创公司 Anthropic 周二发布了一对更新的人工智能模型，可以自主执行计算机任务和保存用户击键的新功能。该公司首席科学官贾里德·卡普兰在接受采访时说，新的“计算机使用”功能可以告诉人工智能将鼠标移动到哪里、点击哪里、输入什么，以完成相当复杂的任务。这项功能专为软件开发人员量身定制，代表着向人工智能代理迈进的一步。该公司提供了三个版本的 Claude 模型，价格根据其性能而有所不同。本周的更新涉及中端型号 Sonnet 和最便宜的 Haiku。“计算机使用”功能目前仅限新版 Claude 3.5 Sonnet，并附带安全措施，以防止该功能应用于垃圾信息和欺诈以及与选举相关的滥用。

—— 路透社

via 风向旗参考快讯 - Telegram Channel

13:56 · 2024年10月23日 · 周三

高通CEO：人工智能手机将在五年内普及

高通公司首席执行官克里斯蒂亚诺·安蒙周二表示，能够在设备端直接处理人工智能的新手机将在几年内普及。高通本周发布了新版骁龙处理器。安蒙在接受采访时表示：“未来五年内，我们所有人可能都会拥有一部人工智能手机。”他指出，问题在于等待应用场景的出现，这种情况在行业向智能手机过渡时也曾发生过。安蒙对高通从智能手机处理器的主业向汽车、计算和工业领域扩张所取得的进展给予了高度评价。“我们从手机业务拓展到汽车、PC，现在又进入了工业领域。我们完全是通过自然发展做到这一切的。我们觉得我们的发展路线非常具有竞争力。”

—— 彭博社

via 风向旗参考快讯 - Telegram Channel

11:28 · 2024年10月23日 · 周三

美国政府对虚假网络评论的禁令现已生效

美国联邦政府对虚假网上评论的禁令已经生效。联邦贸易委员会于8月发布了有关网上评论买卖的最终规定，并在《联邦公报》上公布60天后生效。该机构的委员们一致投票通过了这项规定。该规定禁止企业创建、购买或销售虚构人物的评论和推荐，包括由人工智能生成的评论和推荐。虚假名人代言也是不允许的，企业不得通过付费或其他方式激励真实客户留下正面或负面的评论。某些与公司关系密切的人撰写的评论和推荐若没有免责声明，也是不允许的。征求员工近亲属的评论也受到限制。违反这些措施的罚款代价可能极其高昂。目前，每次违法行为的最高民事罚款为 51,744 美元。

—— Engadget

via 风向旗参考快讯 - Telegram Channel

11:27 · 2024年10月23日 · 周三

OpenAI和微软为人工智能新闻业提供1000万美元资助

10月23日消息，OpenAI和微软正在资助将更多人工智能工具引入新闻编辑室的项目。这两家公司将向芝加哥公共传媒、明尼苏达星坛报、Newsday、费城问询报和西雅图时报提供高达1000万美元的资助。每家新闻出版物都将聘请一名为期两年的人工智能研究员来开发实施该技术并提高业务可持续性的项目。预计还有三家媒体将在第二轮中获得研究金。OpenAI和微软分别贡献了250万美元直接资金以及250万美元软件和企业信贷。

—— Engadget

via 风向旗参考快讯 - Telegram Channel

11:26 · 2024年10月23日 · 周三

Ideogram发布 Canvas 无限创画布工具以及图像填充和扩充工具轻松编辑图像

via XiaoHu.AI学院 (author: 小互)

Telegraph

Ideogram发布 Canvas 无限创画布工具以及图像填充和扩充工具轻松编辑图像

Ideogram发布 Ideogram Canvas ，这是是一个无限的创意画板，用于组织、生成、编辑和组合图像。 Ideogram Canvas 提供一个无限制的画布，用户可以在其上生成、编辑、组合图像。这一功能使创作者可以在一个画板中集成所有元素，从而直观地调整图像布局和内容。高级文本渲染 Ideogram Canvas 拥有先进的文本渲染功能，允许用户在生成图像时添加高精度的文字内容。AI 处理器能够精确理解用户的文本提示，并在图像中生成高质量的文本元素。这一功能适用于广告创意、社交媒体海报设…

08:45 · 2024年10月23日 · 周三

Runway 推出一款生成式角色表演工具可以把视频转换成任意风格虚拟角色动画并且保持表情语音口型同步

via XiaoHu.AI学院 (author: 小互)

Telegraph

Runway 推出一款生成式角色表演工具可以把视频转换成任意风格虚拟角色动画并且保持表情语音口型同步

Runway 推出的一款生成式角色表演工具，Act-One可以通过使用视频和语音输入生成逼真的角色表演，是一种利用生成式模型创建真人动画和动画内容的新方法。轻松制作角色动画：只需要用摄像头录下演员的表演，Act-One 就能把视频转换成虚拟角色的动画，比如演员的眼神、面部表情、动作节奏和说话方式都会被捕捉下来。简单快捷：传统动画制作需要专门的设备和复杂的步骤，比如动作捕捉或面部建模，但用 Act-One，只要一台普通摄像头就能生成逼真的角色动画，大大简化了流程。多种角色风格：Act-One 可以根…

08:16 · 2024年10月23日 · 周三

Anthropic 发布Claude 3.5 Haiku 以及一项炸裂的新功能 AI可以模仿人类访问电脑

via XiaoHu.AI学院 (author: 小互)

Telegraph

Anthropic 发布Claude 3.5 Haiku 以及一项炸裂的新功能 AI可以模仿人类访问电脑

Anthropic 宣布推出改进版的 Claude 3.5 Sonnet、全新的 Claude 3.5 Haiku，以及一项名为“computer use 模拟计算机使用”的新功能。也就是Claude 能够模仿人类的方式使用电脑，它可以自主查看屏幕、移动光标、点击按钮、输入文本等。还能够自动化执行多个步骤的复杂任务，如填写在线表格、搜索数据、提交报告等，从而大幅减少人工操作时间。 Claude 3.5能够在计算机界面上导航，通过切换窗口、打开菜单、选择选项等操作，完成多步骤的任务。开发者可以利用这…

04:58 · 2024年10月23日 · 周三

Elevated errors for requests to Claude 3.5 Sonnet

Oct 22, 13:55 PDT
Investigating - We are currently investigating elevated errors on requests to Claude 3.5 Sonnet on the API, Claude.ai, and the Anthropic Console.

via Anthropic Status - Incident History

03:33 · 2024年10月23日 · 周三

#Update #Claude #Anthropic

Anthropic 刚刚发布了：

- Claude 3.5 Sonnet 新版本和 Claude 3.5 Haiku
- API 新功能：Computer Use，允许 Claude 直接接管电脑、控制鼠标、查看屏幕、打字等操作

via AI Copilot - Telegram Channel

02:58 · 2024年10月23日 · 周三

Anthropic 发布 Claude 3.5 Sonnet 和 Claude 3.5 Haiku，推出计算机使用功能

Anthropic 发布了升级版 Claude 3.5 Sonnet 和全新模型 Claude 3.5 Haiku。Claude 3.5 Sonnet 在编码方面取得了显著进步，超越了所有公开模型。Claude 3.5 Haiku 则在许多评估中与 Claude 3 Opus 性能相当，但成本更低，速度与前一代 Haiku 相似。

同时，Anthropic 还推出了具有计算机使用能力的公测版，使 Claude 能够像人一样使用电脑，进行屏幕查看、光标移动、按钮点击和文本输入等操作。目前，该功能仍处于实验阶段，Asana、Canva 等公司已开始探索其应用。Claude 3.5 Sonnet 现已向所有用户开放，计算机使用测试版也已在 Anthropic API、Amazon Bedrock 和 Google Cloud’s Vertex AI 上线。Claude 3.5 Haiku 将于本月晚些时候发布。

Anthropic

📮 热点投稿 @ZaiHuabot
京东淘宝无门槛红包 m.fanli.me

via 科技圈🎗在花频道📮 - Telegram Channel

02:48 · 2024年10月23日 · 周三

Delayed billing events for API and Console requests

Oct 22, 11:44 PDT
Identified - We have identified an issue resulting in some delayed events related to billing for requests to the Anthropic API and Console. This issue does not affect success rates on the API, but will result in delayed visibility on usage at console.anthropic.com/settings/cost. All usage will still be billed as expected.

via Anthropic Status - Incident History

02:31 · 2024年10月23日 · 周三

新版Claude 3.5 Sonnet将可进行电脑操作 Haiku也将升级到3.5

今天，Anthropic宣布了升级版 Claude 3.5 Sonnet，以及新模型Claude 3.5 Haiku。新版 Claude 3.5 Sonnet 在各方面都比前代有显著提升，尤其是在编码方面——这一领域它本来就处于领先地位。Claude 3.5 Haiku 在许多评估中与 Claude 3 Opus 性能相当，且价格不变。

新版的 Claude 3.5 Sonnet 现已面向所有用户开放。 Claude 3.5 Haiku 将在本月晚些时候发布。

另外，Claude API 还将支持电脑操作，并已进入公共测试阶段。开发人员可以通过API指挥 Claude 像人类一样使用计算机——查看屏幕、移动光标、点击按钮和输入文本。Claude 3.5 Sonnet 是首个在公共测试阶段提供电脑操作功能的模型。

Anthropic不是制作特定的工具来帮助 Claude 完成单独的任务，而是教它一般的计算机技能——允许它使用广泛设计给人的标准工具和软件程序。开发者可以利用这一新能力来自动化重复的过程，构建和测试软件，以及进行开放式任务如研究。

为了使这些通用技能成为可能，Anthropic构建了一个 API，使 Claude 能够感知和与计算机界面互动。开发者可以集成这个 API，以便 Claude 能够将指令（例如，“使用我计算机和在线的数据来填写这个表单”）翻译成计算机命令（例如，检查电子表格；移动光标以打开 web 浏览器；导航到相关网页；使用这些页面的数据填写表单；等等）。在OSWorld上，这个平台评估 AI 模型像人类一样使用计算机的能力，Claude 3.5 Sonnet 在仅截图的类别中得分为 14.9%—显著好于第二好的 AI 系统的得分 7.8%。当被给予更多步骤来完成任务时，Claude 的得分为 22.0%。

Claude 目前使用计算机的能力并不完美。一些人类能轻松完成的动作——滚动、拖动、缩放，目前对 Claude来说仍然是挑战。另外由于AI直接操作电脑可能会带来新的安全威胁（例如垃圾邮件、错误信息或欺诈），Anthropic已经开发出新的过滤器来识别计算机使用的情况以及是否正在发生危害，并采取积极的措施以促进这一功能的安全性。

Claude API操作电脑演示视频
关于Claude电脑操作的更多信息

via : anthropic.com
📣 AI新闻频道

YouTube

Claude | Computer use for automating operations

With the upgraded Claude 3.5 Sonnet, we’re introducing a new capability in beta: computer use. Developers can now direct Claude to use computers the way people do—by looking at a screen, moving a cursor, clicking, and typing text.

At this stage, it is still…

Before

After