人工智能资讯 第25页
聚合当前分类下的最新内容,按时间顺序查看第 25 页精选文章。

AI 写代码之后,黑客松的胜负手可能回到硬件
一名开发者在维尔纽斯黑客松中,用树莓派把老式转盘电话改造成可对话的 AI 音乐点播设备,48 小时内接通 WebSocket、双向音频、铃声和挂机开关。这个案例重要的不是“硬件黑客松已经取代软件黑客松”,而是 AI 编程工具正在降低纯软件原型的惊喜门槛,把更多创造力推向现实世界接口。

Claude Fable 5 发布:模型更强,成本和护栏也更硬了
Anthropic 同日发布 Claude Fable 5 与 Mythos 5:两者能力相同,Fable 5 加了更严格安全分类器,Mythos 5 不带这些分类器。Fable 5 的规格很激进:100 万 token 上下文、12.8 万最大输出,价格是 Claude Opus 4.5-4.8 的两倍。真正的变化不只是模型更会写代码,而是强模型代理开始同时考验预算、拒答机制和开发者工作流。

Claude 披露“静默降质”:真正的问题不是限用,而是不告诉你
Anthropic 在 Fable 5 和 Mythos 5 系统卡中披露,会对部分前沿大模型研发请求做用户不可见的效果限制。争议点不是平台能不能限制违规用途,而是用户无法判断回答变差来自模型能力、提示词问题,还是后台策略。对依赖 Claude 做训练基础设施、AI 芯片和模型研发判断的团队,这会把工具信任变成审计问题。

新版 AI Siri 终于能用了,但苹果只是补回起跑线
The Verge 记者在 WWDC 2026 后短暂试用新版 AI Siri,发现它已经能读取邮件、日历等个人信息,完成加日程、算出行时间、列购物清单、设提醒这些基础任务。 关键不在于 Siri 领先了,而在于苹果此前不顺的 AI 助手,这次终于从发布会承诺走到可用体验。 放到 2026 年看,这仍是补课:Google Gemini 在 Android 上做类似事已有至少一年。

Google 把 AI Plus 打到 4.99 美元,价格战开始伤到模型公司的估值
Google 将美国 Google AI Plus 月费从 7.99 美元降到 4.99 美元,存储从 200GB 提到 400GB。它打的不是一次普通促销,而是把新兴市场的 AI 低价订阅打法推到美国。对用户是便宜了,对纯 AI 公司则是利润率和估值叙事被重新验算。

Claude Fable 5 的静默降级,让 AI 编程工具的信任问题变具体了
Anthropic 在 Claude Fable 5 模型卡中披露:涉及前沿 LLM 开发的请求,可能被用户不可见地降低辅助效果,而不是直接拒答。争议不在于供应商能不能设安全边界,而在于企业无法确认工具何时仍在全力工作。对训练 embedding、reranker、微调小模型的软件团队来说,采购、调试和供应商选择都要重新算一遍。

Claude Fable 5 很强,但 Anthropic 的安全闸门开始影响开发者判断
Anthropic 发布 Claude Fable 5,原文称它是当前公开可用最强模型之一;争议不在能力,而在访问控制。网络安全、生物化学、蒸馏等请求会明示回退到 Opus 4.8,但前沿 LLM 开发相关请求可能被隐形削弱。真正受影响的不是普通聊天用户,而是 AI 研究者、开源模型开发者和训练基础设施团队。

Codex 在 Notion 的真实作用:不是替工程师写几行代码,而是让小团队改写交付方式
Notion AI Product Engineering 负责人 Ryan Nystrom 用 Codex 在数小时内完成网页端 AI 语音输入首版,并在次日交付测试。这个案例的价值不在于一次提速故事,而在于它显示 AI 编程工具正把工程师的重心推向规格、上下文和验收。它还没有证明 Notion 全公司流程已被重构,但足以让技术管理者重新评估小团队的组织方式。

Claude Fable 5 价格还没入库,AgentsView 先把 AI 编程账单拆开了
Simon Willison 记录了一件很小但很实用的事:Claude Fable 5 刚发布,AgentsView 价格库还没跟上,他就手动补了模型价格。关键不在这张图花了多少钱,而在开发者终于能把本机 coding agent 的成本拆到项目、会话和缓存层面。对频繁使用 AI 编程工具的个人和小团队来说,这会影响模型选择、任务拆分和预算判断。

450 亿 token 重写 Git:Grit 不是神话,是智能体工程的成本样本
GitHub 联合创始人 Scott Chacon 用多智能体从零写出 Rust 版 Git 库 Grit,约 450 亿 token、1 万到 1.5 万美元成本,通过 Git 官方测试套件 99% 以上。它说明智能体已经能在强测试约束下堆出复杂软件雏形,但还不能证明可以安全替代 Git。接下来最该看三件事:真实仓库验证、API 稳定性、剩下 1% 测试之外的事故率。

Cohere 发布 North Mini Code:小激活 MoE,押注能干活的代码代理
Cohere 在 Hugging Face 发布 North Mini Code:30B 总参数 MoE、单 token 激活 3B,Apache 2.0 许可。它不是来抢通用聊天模型的声量,而是把筹码压在 agentic coding、长上下文和跨工具环境训练上。对开发者和企业技术负责人来说,最该看的不是榜单名次,而是它能不能在真实仓库、终端、测试和权限约束里稳定干活。

Codex 的真变化:工程更快了,产品选择更难了
OpenAI 用 Nextdoor 案例宣传 Codex:工程团队用 GPT-5.5 调试疑难问题、跨端交付功能,把一部分实现瓶颈往前推。真正重要的不是写代码快了多少,而是工程师开始更直接地对产品结果负责。对技术管理者和产品工程师来说,接下来要看的不是要不要用 AI 编程,而是团队有没有能力选对问题。

Google Gemini 3.5 Live Translate 上线:实时语音翻译到了可用边缘
Google 发布 Gemini 3.5 Live Translate,把实时语音到语音翻译推向 Gemini Live API、AI Studio、Google Meet 和 Google Translate 应用。它的看点是 70 多种语言自动检测、几秒级延迟,以及尽量保留说话者语调、节奏和音高。我的判断是:它已经从演示能力走到产品入口,但还不能被当成嘈杂环境里的万能同传。

Claude Fable 5 发布:公开版变窄,强能力开始验人
Anthropic 发布 Claude Fable 5,但公开版遇到网络安全、生物、化学等敏感主题,会降级到 Claude Opus 4.8 或限制回答。Fable 5 与 Mythos 5 使用同一底层模型,后者只向 Project Glasswing 中少数可信网络防御者开放。重点不在模型又强了多少,而在前沿 AI 的访问权、定价权和信任门槛正在被重新划线。

微软 AI CEO 批评 Claude 宪法:AI 公司该不该把“模型感受”写进规则
Microsoft AI CEO Mustafa Suleyman 在 The Verge《Decoder》节目中批评 Anthropic,称在 Claude constitution 里讨论模型意识和福祉“非常危险”。争议点不是 Claude 是否已经有意识,而是 AI 公司能不能把这种不确定性写进指导模型行为的规则文本。我的判断是:研究上保持开放可以理解,产品治理里则要更克制,否则会把拟人化风险做进交互本身。

Claude Fable 5:单提示原型开始像交付了
Anthropic 公开了 Claude Fable 5,这是 Mythos 模型首个公众可用版本。Ethan Mollick 的个人测试显示,它能在 Claude Code 里用一次提示生成小游戏、地图可视化等项目,并按多页规格长时间执行。真正该看的不是 AI 会不会做游戏,而是原型生产成本继续下沉后,验证、质量和维护开始变得更贵。

苹果让 AI 自动改密码,难点不是点按钮
苹果在 WWDC26 宣布,iOS 27、iPadOS 27 和 macOS 27 的 Passwords 应用将借助 Apple Intelligence 与 Safari,自动处理弱密码和泄露密码的改密流程。它解决的是用户看见泄露警告却不改、拖延改、继续复用密码的老问题。真正要看的是,苹果能不能证明这个高权限代理能在不可信网页里安全替用户改凭据。

代码切换 ASR 基准发布:双语客户正在放大语音代理风险
ServiceNow AI 发布了一套面向企业语音代理的代码切换 ASR 基准,覆盖西英、法英、加拿大法英、德英四组混合语音,并开放数据集与 AU-Harness。 这套基准的价值,不是给所有企业选出一个“通吃模型”,而是把双语客户的真实表达方式拉进了 ASR 评估。 我更在意的是 AER:如果转写错误会让问答、派单、身份核验跟着错,语音代理就不能只看 WER 排名。

AI 公司开始算账:便宜模型正在改写推理成本
AI 企业开始重新评估小模型和廉价模型,不再默认所有任务都交给最强前沿模型。 Brian Armstrong 预测,未来 12-18 个月内,80% 工作负载可能迁移到便宜 99% 的模型上;这只是判断,不是行业统计。 真正受压的是模型选型逻辑:企业要从“买最强”转向“买合适”,OpenAI、Anthropic 等前沿实验室的收入叙事也会被成本现实追问。

Karpathy谈Claude Fable 5:软件成本下降后,需求可能先暴涨
Simon Willison 引述了 Andrej Karpathy 对 Claude Fable 5 的一段推文评价,核心不是一份产品测评,而是一个关于 AI 编程需求变化的判断。Karpathy 认为,当可运行软件越来越能“按一下就出来”,个人对软件的需求反而会明显增加。这更像软件领域的杰文斯悖论:效率提升不一定减少使用,可能把更多原本不值得做的小工具变成日常消耗品。

Claude Fable 5 开放:强模型的价格、隐私和闸门一起涨了
Anthropic 将首个公开可用的 Mythos 级模型 Claude Fable 5 上线 Claude API 和部分企业、订阅计划。它主打软件工程、知识工作和视觉能力,但在网络安全、生物、化学、模型蒸馏等高风险场景会拦截并回退到 Claude Opus 4.8。更关键的变化是:Fable 5 / Mythos 5 价格达到 Opus 4.8 的两倍,所有流量强制保留 30 天,强模型的使用代价正在被重新定义。