https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持Deepseek、OpenAI(o3/GPTs/Sora/实时语音)、Claude、Gemini、Midjourney、文件上传
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持Deepseek、OpenAI(o3/GPTs/Sora/实时语音)、Claude、Gemini、Midjourney、文件上传
Buy ads: https://telega.io/c/AI_News_CN
💻 Gemini 2.5 Pro 与 Claude 3.7 Sonnet 编码能力大比拼:实战经验与局限性探讨
近期开发者社区围绕 Google Gemini 2.5 Pro 和 Anthropic Claude 3.7 Sonnet 两大语言模型的编程能力展开了激烈讨论。一项将 Solvespace 项目中约 2000 行 C++ GTK3 代码移植到 GTK4 的实际挑战被提出,用以检验当前 LLM 处理真实世界复杂编程任务的能力和局限性。
用户反馈呈现多样化:
* Gemini 2.5 Pro:在 aider 多语言编码排行榜上以 73% 的得分领先于 Sonnet 3.7 的 65%。部分用户认为其在从零生成代码、处理复杂逻辑(如并发问题)方面表现更优,并拥有 100 万 token 的超长上下文窗口(相比 Claude 的 20 万 token),且可通过 AI Studio 免费试用。然而,也有用户批评其在修改现有代码时难以遵循精确指令、易进行无关更改、有时拒绝输出完整代码或生成冗余代码。
* Claude 3.7 Sonnet:许多用户认为其在重构现有代码、遵循指令和工具使用(如 Cursor、MCP)方面更胜一筹,更适合迭代式开发。但也有不少用户反映 3.7 版本相较 3.5 表现有所下降,存在过度修改代码、难以控制等问题,甚至有用户认为其“思维混乱”,尤其在“思考”模式下。
普遍观点认为,尽管 LLM 在特定、小范围任务或全新项目(Greenfield Project)上表现亮眼,但在处理大型、复杂或遗留代码库时仍显不足,难以进行需要深度理解和多轮迭代的复杂修改,且容易引入技术债。提供充足的上下文(如 API 文档)和使用专业辅助工具(如 aider)被认为是提升 LLM 编码效果的关键。
总体而言,开发者对 LLM 能否短期内取代软件工程师持谨慎态度,认为当前技术更适合作为特定任务的辅助工具。两种模型各有优劣,实际表现高度依赖于具体任务场景、用户的使用方式和提示技巧。社区对 LLM 在真实编程环境中的实用价值仍在持续评估和讨论中。
(HackerNews)
via 茶馆 - Telegram Channel
近期开发者社区围绕 Google Gemini 2.5 Pro 和 Anthropic Claude 3.7 Sonnet 两大语言模型的编程能力展开了激烈讨论。一项将 Solvespace 项目中约 2000 行 C++ GTK3 代码移植到 GTK4 的实际挑战被提出,用以检验当前 LLM 处理真实世界复杂编程任务的能力和局限性。
用户反馈呈现多样化:
* Gemini 2.5 Pro:在 aider 多语言编码排行榜上以 73% 的得分领先于 Sonnet 3.7 的 65%。部分用户认为其在从零生成代码、处理复杂逻辑(如并发问题)方面表现更优,并拥有 100 万 token 的超长上下文窗口(相比 Claude 的 20 万 token),且可通过 AI Studio 免费试用。然而,也有用户批评其在修改现有代码时难以遵循精确指令、易进行无关更改、有时拒绝输出完整代码或生成冗余代码。
* Claude 3.7 Sonnet:许多用户认为其在重构现有代码、遵循指令和工具使用(如 Cursor、MCP)方面更胜一筹,更适合迭代式开发。但也有不少用户反映 3.7 版本相较 3.5 表现有所下降,存在过度修改代码、难以控制等问题,甚至有用户认为其“思维混乱”,尤其在“思考”模式下。
普遍观点认为,尽管 LLM 在特定、小范围任务或全新项目(Greenfield Project)上表现亮眼,但在处理大型、复杂或遗留代码库时仍显不足,难以进行需要深度理解和多轮迭代的复杂修改,且容易引入技术债。提供充足的上下文(如 API 文档)和使用专业辅助工具(如 aider)被认为是提升 LLM 编码效果的关键。
总体而言,开发者对 LLM 能否短期内取代软件工程师持谨慎态度,认为当前技术更适合作为特定任务的辅助工具。两种模型各有优劣,实际表现高度依赖于具体任务场景、用户的使用方式和提示技巧。社区对 LLM 在真实编程环境中的实用价值仍在持续评估和讨论中。
(HackerNews)
via 茶馆 - Telegram Channel
路透社3月31日报道,OpenAI 首席执行官 Sam Altman 周一表示,该公司计划在未来几个月内发布自 GPT-2 以来的首个具有推理能力的开源权重语言模型。Altman 在 X 平台发帖称,公司将与开发者沟通如何使其更有用。开源权重模型允许根据新的输入数据或任务调整或微调模型的权重。Altman 补充说,公司仍在做一些决策,并将举办开发者活动以收集反馈并测试早期原型。
(路透社)
via 茶馆 - Telegram Channel
Manus 推出付费订阅计划和移动应用
中国 AI 智能体平台 Manus AI 周一推出了两项订阅计划,起价为39美元/月。Manus 仍处于测试阶段,这是一款 AI 智能体工具,可用于完成从创建婚礼请柬网页到制作棒球比赛计分表等各种任务。Manus 的新高级计划中较便宜的方案每月收费39美元,包含3900积分,同时最多运行两个任务。另一种更昂贵的新计划每月收费199美元,包含 19900 积分,最多同时运行五个任务,并在高峰时段享有优先访问。在今天对其平台的其他升级中,Manus 发布了一款 iOS 应用,并将为其后端提供支持的 AI 模型升级为 Anthropic 公司的 Claude 3.7 Sonnet。
—— Techcrunch、应用下载
via 风向旗参考快讯 - Telegram Channel
中国 AI 智能体平台 Manus AI 周一推出了两项订阅计划,起价为39美元/月。Manus 仍处于测试阶段,这是一款 AI 智能体工具,可用于完成从创建婚礼请柬网页到制作棒球比赛计分表等各种任务。Manus 的新高级计划中较便宜的方案每月收费39美元,包含3900积分,同时最多运行两个任务。另一种更昂贵的新计划每月收费199美元,包含 19900 积分,最多同时运行五个任务,并在高峰时段享有优先访问。在今天对其平台的其他升级中,Manus 发布了一款 iOS 应用,并将为其后端提供支持的 AI 模型升级为 Anthropic 公司的 Claude 3.7 Sonnet。
—— Techcrunch、应用下载
via 风向旗参考快讯 - Telegram Channel
亚马逊推出可控制网络浏览器的AI智能体
亚马逊周一推出了 Nova Act,这是一款通用型人工智能智能体,可以控制网络浏览器并独立执行一些简单操作。除了新智能体 AI 模型外,亚马逊还发布了 Nova Act SDK,这是一个允许开发者使用 Nova Act 构建智能体原型的工具包。Nova Act 由亚马逊最近在美国旧金山开设的 AGI 实验室开发,还将为该公司即将推出的 Alexa +升级版关键功能提供支持,Alexa +是亚马逊流行语音助手的生成式人工智能增强版本。然而,从今天开始提供的 Nova Act 版本尚不够完善。亚马逊称其为研究预览版。开发者可以通过亚马逊的新网站「链接」访问 Nova Act 工具包。
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel
亚马逊周一推出了 Nova Act,这是一款通用型人工智能智能体,可以控制网络浏览器并独立执行一些简单操作。除了新智能体 AI 模型外,亚马逊还发布了 Nova Act SDK,这是一个允许开发者使用 Nova Act 构建智能体原型的工具包。Nova Act 由亚马逊最近在美国旧金山开设的 AGI 实验室开发,还将为该公司即将推出的 Alexa +升级版关键功能提供支持,Alexa +是亚马逊流行语音助手的生成式人工智能增强版本。然而,从今天开始提供的 Nova Act 版本尚不够完善。亚马逊称其为研究预览版。开发者可以通过亚马逊的新网站「链接」访问 Nova Act 工具包。
—— Techcrunch
via 风向旗参考快讯 - Telegram Channel
Anthropic宣布Claude 4.0架构重大升级:取消Opus版本,全系标配多模态能力,2025年Q2正式发布
人工智能研究公司Anthropic今日通过开发者博客公布了下一代大语言模型Claude 4.0的详细规划。此次升级将重构现有产品线:取消旗舰级Opus版本,聚焦于Sonnet(中端)和Haiku(轻量级)双版本战略,同时为全系列首次引入视觉理解与生成能力。新模型计划于2025年第二季度正式发布,目前已向企业合作伙伴开放早期测试通道。
精简产品线
将取消旗舰版 Opus,保留 Sonnet(中阶) 和 Haiku(轻量) 双版本。Anthropic 首席产品官 Elena Rodriguez 解释:"Claude 4.0 的架构效率提升使得 Sonnet 已能达到原 Opus 90% 的性能,同时 Haiku 将首次获得完整推理链能力(Chain-of-Thought Reasoning)"。
全系多模态突破
视觉理解(Vision):Claude 4.0将支持图像/图表解析,适用于科研文献解读、工程图纸分析等场景。
基础图像生成:通过合作开源模型(疑似基于Claude自研扩散架构),用户可直接通过文本描述生成草图级图像,Anthropic强调该功能"严格遵循安全协议"。
至于价格方面,Sonnet价格不变但将上下文窗口免费扩容至500K,Haiku 定价有望下调 50%(预计 $0.5/百万token),维持低价策略适应高频调用需求。
合规增强:新增"政府/医疗专用模式",支持GDPR/HIPAA等法规的数据隔离处理。
Anthropic 同时预告将在 2025 年 Q3 推出 企业专属模型微调服务,允许客户注入私有数据训练定制版本。
Tirias Research 首席分析师 Kevin Krewell 指出:"取消 Opus 表明 Anthropic 正在优化算力分配,其 500K 上下文窗口可能重新定义长文档分析的市场标准。"
📣 AI新闻频道
人工智能研究公司Anthropic今日通过开发者博客公布了下一代大语言模型Claude 4.0的详细规划。此次升级将重构现有产品线:取消旗舰级Opus版本,聚焦于Sonnet(中端)和Haiku(轻量级)双版本战略,同时为全系列首次引入视觉理解与生成能力。新模型计划于2025年第二季度正式发布,目前已向企业合作伙伴开放早期测试通道。
精简产品线
将取消旗舰版 Opus,保留 Sonnet(中阶) 和 Haiku(轻量) 双版本。Anthropic 首席产品官 Elena Rodriguez 解释:"Claude 4.0 的架构效率提升使得 Sonnet 已能达到原 Opus 90% 的性能,同时 Haiku 将首次获得完整推理链能力(Chain-of-Thought Reasoning)"。
全系多模态突破
视觉理解(Vision):Claude 4.0将支持图像/图表解析,适用于科研文献解读、工程图纸分析等场景。
基础图像生成:通过合作开源模型(疑似基于Claude自研扩散架构),用户可直接通过文本描述生成草图级图像,Anthropic强调该功能"严格遵循安全协议"。
至于价格方面,Sonnet价格不变但将上下文窗口免费扩容至500K,Haiku 定价有望下调 50%(预计 $0.5/百万token),维持低价策略适应高频调用需求。
合规增强:新增"政府/医疗专用模式",支持GDPR/HIPAA等法规的数据隔离处理。
Anthropic 同时预告将在 2025 年 Q3 推出 企业专属模型微调服务,允许客户注入私有数据训练定制版本。
Tirias Research 首席分析师 Kevin Krewell 指出:"取消 Opus 表明 Anthropic 正在优化算力分配,其 500K 上下文窗口可能重新定义长文档分析的市场标准。"
📣 AI新闻频道
Claude.ai / console.anthropic.com - Partial outage
Mar 31, 07:52 PDT
Update - We are continuing to investigate this issue.
Mar 31, 07:52 PDT
Investigating - We are currently investigating this issue.
via Anthropic Status - Incident History
Mar 31, 07:52 PDT
Update - We are continuing to investigate this issue.
Mar 31, 07:52 PDT
Investigating - We are currently investigating this issue.
via Anthropic Status - Incident History
📢导航站收录更新通知!
#AI·工具集 #AI新时代
站点名称: AI 翻译 - 免费在线翻译工具
描述: 免费的 AI 驱动翻译工具,提供多种语言之间的即时准确翻译。无需注册。
链接: https://ai-translator.cc/zh
前往导航: www.noisedh.cn 或 www.noisedh.link
via 🎉 Efficiency资源干货全收录 - Telegram Channel
#AI·工具集 #AI新时代
站点名称: AI 翻译 - 免费在线翻译工具
描述: 免费的 AI 驱动翻译工具,提供多种语言之间的即时准确翻译。无需注册。
链接: https://ai-translator.cc/zh
前往导航: www.noisedh.cn 或 www.noisedh.link
via 🎉 Efficiency资源干货全收录 - Telegram Channel