https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持Deepseek、OpenAI(o3/GPTs/Sora/实时语音)、Claude、Gemini、Midjourney、文件上传
Buy ads: https://telega.io/c/AI_News_CN
Elevated errors for requests to Claude 3.5 Sonnet

Mar 29, 16:19 PDT
Investigating - We are currently investigating elevated errors on requests to Claude 3.5 Sonnet on the API, Claude.ai, and the Anthropic Console.

via Anthropic Status - Incident History
claude.ai not loading

Mar 29, 13:05 PDT
Investigating - We are currently investigating this issue.

via Anthropic Status - Incident History
Gemini 2.5 Pro Experimental 对免费用户的每日请求次数限制进行了调整,从原先的50次/日下调至25次/日。

Gemini文档
Wayback Machine

📮投稿☘️频道🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel
欧盟将投资13亿欧元发展AI等关键技术

欧盟委员会3月28日宣布将在2025年至2027年间投资13亿欧元用于部署对欧洲具有战略意义的关键技术,包括AI和云计算等。欧盟委员会表示,相关资金将通过 “数字欧洲” 项目,向人工智能的部署及其在企业和公共管理中的应用、云计算和数据、网络韧性、数字技术人才培养等领域注资。数字欧洲关注的重点项目包括改善生成式人工智能应用的可及性,特别是在医疗护理领域的应用;帮助构建更强大的地球气候模型,支持气候适应性研究和灾害风险管理;强化医院、海底电缆等关键基础设施的网络安全等。

—— 新华社

via 风向旗参考快讯 - Telegram Channel
OpenAI 须在年底前完成营利性转型,否则无法获得 400 亿美元全额融资

《华尔街日报》今日报道称,OpenAI 必须在今年年底前转型为一家营利性公司才能获得由软银领投、处于最后阶段的 400 亿美元全额融资。如果 OpenAI 无法在今年年底前重组为一家营利性公司,本轮融资规模可能会缩减至 200 亿美元(现汇率约合 1453.6 亿元人民币)。

消息人士透露,根据融资协议细节,软银集团将先行投资 75 亿美元,另有财团注资 25 亿美元。多名知情人士称,对冲基金 Magnetar Capital 可能会贡献 10 亿美元资金。此外,今年晚些时候将启动第二轮 300 亿美元融资,其中软银计划再投 225 亿美元,财团出资 75 亿美元。

华尔街日报

📮投稿 ☘️频道 🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel
GPT-4o图像生成的秘密OpenAI没说,网友已经拼出真相?

然而,OpenAI 一向并不 Open,这次也不例外。他们只是发布一份 GPT-4o 系统卡附录(增补文件),其中也主要是论述了评估、安全和治理方面的内容。地址:https://cdn.openai.com/11998be9-5319-4302-bfbf-1167e093f1fb/Native_Image_Generation_System_Card.pdf对于技术,在这份长达 13 页的附录文件中,也仅在最开始时提到了一句:“不同于基于扩散模型的 DALL・E,4o 图像生成是一个嵌入在 ChatGPT 中的自回归模型。”OpenAI 对技术保密,也抵挡不住大家对 GPT-4o 工作方式的热情,现在网络上已经出现了各种猜测、逆向工程。比如Google DeepMind 研究者 Jon Barron 根据 4o 出图的过程猜测其可能是组合使用了某种多尺度技术与自回归。不过,值得一提的是,香港中文大学博士生刘杰(Jie Liu)在研究 GPT-4o 的前端时发现,用户在生成图像时看到的逐行生成图像的效果其实只是浏览器上的前端动画效果,并不能准确真实地反映其图像生成的具体过程。实际上,在每次生成过程中,OpenAI 的服务器只会向用户端发送 5 张中间图像。您甚至可以在控制台手动调整模糊函数的高度来改变生成图像的模糊范围!因此,在推断 GPT-4o 的工作原理时,其生成时的前端展示效果可能并不是一个好依据。尽管如此,还是让我们来看看各路研究者都做出了怎样的猜测。整体来说,对 GPT-4o 原生图像生成能力的推断主要集中在两个方向:自回归 + 扩散生成、非扩散的自回归生成。下面我们详细盘点一下相关猜想,并会简单介绍网友们猜想关联的一些相关论文。猜想一:自回归 + 扩散很多网友猜想 GPT-4o 的图像生成采用了“自回归 + 扩散”的范式。比如 CMU 博士生 Sangyun Lee 在该功能发布后不久就发推猜想 GPT-4o 会先生成视觉 token,再由扩散模型将其解码到像素空间。而且他认为,GPT-4o 使用的扩散方法是类似于 Rolling Diffusion 的分组扩散解码器,会以从上到下的顺序进行解码。他进一步给出了自己得出如此猜想的依据。理由 1:如果有一个强大的条件信号(如文本,也可能有视觉 token),用户通常会先看到将要生成的内容的模糊草图。因此,那些待生成区域会显示粗糙的结构。理由 2:其 UI 表明,图像是从顶部到底部生成的。Sangyun Lee 曾在自己的研究中尝试过底部到顶部的顺序。Sangyun Lee 猜想到,这样的分组模式下,高 NFE(函数评估数量)区域的 FID 会更好一些。但在他研究发现这一点时,他只是认为这是个 bug,而非特性。但现在情况不一样了,人们都在研究测试时计算。最后,他得出结论说:“因此,这是一种介于扩散和自回归模型之间的模型。事实上,通过设置 num_groups=num_pixels,你甚至可以恢复自回归!”另外也有其他一些研究者给出了类似的判断:如果你对这一猜想感兴趣,可以参看以下论文:Rolling Diffusion Models,arXiv:2402.09470;Sequential Data Generation with Groupwise Diffusion Process, arXiv:2310.01400Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model,arXiv:2408.11039猜想二:非扩散的自回归生成使用过 GPT-4o 的都知道,其在生成图像的过程中总是先出现上半部分,然后才生成完整的图像。Moonpig 公司 AI 主管 Peter Gostev 认为,GPT-4o 是采用从图像的顶部流 token 开始生成图像的,就像文本生成方式一样。来源:https://www.linkedin.com/feed/update/urn:li:activity:7311176227078172674/Gostev 表示,与传统的图像生成模型相比,GPT-4o 图像生成的关键区别在于它是一个自回归模型。这意味着它会像生成文本一样,按顺序逐个流式传输图像 token。相比之下,基于扩散过程的模型(例如 Midjourney、DALL-E、Stable Diffusion)通常是从噪声到清晰图像一次性完成转换。这种自回归模型的主要优势在于,模型不需要一次性生成整个全局图像。相反,它可以通过以下方式来生成图像:利用其模型权重中嵌入的通用知识;通过按顺序流式传输 token 来更连贯地生成图像。更进一步的,Gostev 认为,如果你使用 ChatGPT 并点击检查(Inspect),然后在浏览器中导航到网络(Network)标签,就可以监控浏览器与服务器之间的流量。这让你能够查看 ChatGPT 在图像生成过程中发送的中间图像,从而获得一些有价值的线索。Gostev 给出了一些初步的观察结果(可能并不完整):图像是从上到下生成的;这个过程确实涉及流 token,与扩散方法截然不同;从一开始,就可以看到图像的大致轮廓;先前生成的像素在生成过程中可能会发生显著变化;这可能表明模型采用了某种连贯性优化,尤其是在接近完成阶段时更加明显。最后,Gostev 表示还有一些无法直接从图像中看到的额外观察结果:对于简单的图像生成,GPT-4o 速度要快得多,通常只有一个中间图像,而不是多个。这可能暗示使用了推测解码或其他类似方法;图像生成还具备背景移除功能,从目前的情况来说,最初 GPT-4o 生成图片会呈现一个假的棋盘格背景,直到最后才移除实际背景,这会略微降低图像质量。这似乎是一个额外的处理过程,而不是 GPT-4o 本身的功能。开发者 @KeyTryer 也给出了自己的猜想。他说 4o 是一种自回归模型,通过多次通过来逐像素地生成图像,而不是像扩散模型那样执行去噪步骤。而这种能力本身就是 GPT-4o LLM 神经网络的一部分。理论上讲,它能够比扩散系统更好地掌握它们正在操作的概念,而扩散系统只是对随机噪声的一种猜测。GPT-4o 还能够使用 LLM“知道”的信息来生成图像。也因此,它们具有更好的泛化能力,能够使用多条消息进行上下文学习,通过特定的编辑输出相同(或非常接近)的结果,并且具有广义的空间和场景感。芬兰赫尔辛基的大学副教授 Luigi Acerbi 也指出,GPT-4o 基本就只是使用 Transformer 来预测下一个 token,并且其原生图像生成能力一开始就有,只是一直以来都没有公开发布。不过,Acerbi 教授也提到,OpenAI 可能使用了扩散模型或或一些修饰模型来为 GPT-4o 生成的图像执行一些清理或添加小细节。GPT-4o 原生图像生成功能究竟是如何实现的?这一点终究还得等待 OpenAI 自己来揭秘。对此,你有什么自己的猜想呢? ...

PC版:https://www.cnbeta.com.tw/articles/soft/1489108.htm
手机版:https://m.cnbeta.com.tw/view/1489108.htm

via cnBeta.COM中文业界资讯站 - Telegram Channel
马斯克xAI蛇吞𝕏:资本有了,数据有了,商业模式也有了

https://mp.weixin.qq.com/s/AUJdoUWEANx3rRy-D9w3SA
软银或在美国投资1万亿美元建AI产业园

软银集团计划在美国各地建立配备人工智能工厂的工业园区。这家日本科技投资者可能承诺在此类投资上投入约 1 万亿美元。孙正义正准备访问美国,并可能很快宣布他与特朗普政府的最新大型项目。由于预计美国劳动力增长将放缓,软银相信使用人工智能机器人将有助于美国制造业保持竞争力。该集团正在考虑从英伟达采购图形处理单元,并可能引进德国机器人公司 Agile Robots 的技术。消息人士称,潜在的合作制造商包括台湾公司富士康。软银集团目标是通过在智能手机、汽车、服务器和空调等各种产品的生产过程中采用人工智能来减少人工参与。

—— 日经亚洲

via 风向旗参考快讯 - Telegram Channel
Back to Top
oaibest.com 2023-2025
admin@oaibest.com