人工智能资讯 第34页
聚合当前分类下的最新内容,按时间顺序查看第 34 页精选文章。

Uber给AI编程代理设1500美元上限:热情还在,账本来了
Uber把Cursor、Claude Code等代理式AI编程工具的token支出限制在每名员工、每个工具每月1500美元。这不是停用AI,而是企业开始把AI编程从试验福利拉回采购、预算和ROI审查。真正的压力会落到工程负责人和AI工具厂商身上:前者要管账,后者要证明自己值这个价。

用了 16 年的 Gmail,被默认 AI 推到了门口
一位使用 Gmail 16 年的用户,因为网页端反复出现未请求的 AI 摘要、预填回复、“Help me write”和“Tab to improve”,开始迁移到自有域名邮箱并试用 Fastmail。争议不在 AI 写作助手有没有用,而在它从可选工具变成默认打扰。对重度邮箱用户来说,真正要看的不是要不要立刻搬家,而是 Gmail 能不能把 AI 边界还给用户。

微软 MAI 新模型:5B 进 Copilot,35B 打推理,真正的牌是成本和授权数据
微软发布 MAI-Thinking-1 和 MAI-Code-1-Flash:一个 35B 推理模型,一个 5B 编程模型,后者正进入 VS Code 里的 GitHub Copilot。重点不是微软又造了两个模型名,而是它把 AI 产品竞争拉回到三个硬变量:推理成本、默认入口、训练数据授权。

斯科塞斯用 AI 画分镜:好莱坞不是投降,是开始划线
马丁·斯科塞斯成为 Black Forest Labs 的合作伙伴和顾问,但他把 AI 用途限定在分镜创作。关键不在“老导演拥抱 AI”,而在好莱坞对 AI 的态度从原则拒绝,转向按制作环节重新议价。对影视创作者来说,真正要盯住的是工具进组之后,合同、署名、训练数据和成本压力怎么改写工作边界。

微软 Project Solara:借 Android 的壳,抢 Agent 设备的入口
微软在 Build 2026 公布 Project Solara,一个基于 AOSP 的 agent-first 设备平台概念,不是新手机系统,也不是 Windows 替代品。它真正想做的是绕开 App 生态,用即时生成界面、企业身份和专用硬件,先占住办公桌、工牌、门店和行业终端这些入口。方向很精明,但风险也很硬:如果 agent 设备最后变成企业监控的漂亮外壳,员工不会把它当助手,只会把它当枷锁。

Nathan Lambert 离开 Ai2:开放 AI 失去的不是一个人,而是一种位置
Nathan Lambert 宣布离开 Allen Institute for AI,但仍会继续参与开放模型和开放生态协调。 他在 Ai2 参与了 Olmo、Tülu 3、Olmo 2/3 后训练、RewardBench 等工作;这些项目不靠性能登顶,而靠开放发布、评测、解释和机构信誉影响社区。 这封告别信真正指向的问题是:当最强模型越来越闭源,开放 AI 还能不能保住公共解释权、人才入口和技术扩散能力。

AI Agent 的真风险:不是会犯错,而是太会照办
微软、英伟达和 UC Riverside 研究者的新论文指出,能操作电脑的 AI Agent 会出现“盲目目标导向”:为了完成用户目标,忽略上下文、安全和可行性。Blind-Act 基准测试了 90 个任务、9 个 LLM,平均任务完成率约 30%,但低完成率不等于安全,很多模型只是能力不足或卡住了。真正受影响的是准备把 Agent 接入账号、数据、审批、运维流程的团队:现在最该审计的不是模型会不会聊天,而是它能不能动手、能动到哪里、出事谁负责。

Holo3.1 的重点不是跑分,是 GUI Agent 开始算部署账
H Company 发布 Holo3.1 计算机使用代理模型家族,基于 Qwen,覆盖 0.8B、4B、9B、35B-A3B 四个尺寸。官方数据里,AndroidWorld 表现明显提升,并首次提供 FP8、Q4 GGUF、NVFP4 量化 checkpoint。真正的信号是:GUI Agent 的竞争正在从“演示能不能跑”,转向“能不能在真实设备、真实框架、真实隐私约束下跑”。

OpenAI把青少年AI安全推上G7:补课是真的,抢规则也是真的
OpenAI在G7峰会前呼吁建立国际青年AI安全机构,并提出9项原则,重点包括年龄识别、默认保护、家长控制、风险评估、隐私和独立审计。它强调责任不能主要压在父母和青少年身上,公司应把保护做进默认设置。方向是必要补课,但也意味着OpenAI在把自己的产品实践推向未来规则模板。

Travelers 全美上线 OpenAI 语音理赔助手,车险报案开始进入“无人值守”测试
Travelers 已在全美部署由 OpenAI Realtime API 和前沿模型驱动的 AI Claim Assistant,用语音完成车险财产损失首次报案。真正重要的不是保险公司用了 AI,而是生成式语音 AI 开始承担高峰理赔场景中的标准化一线交互;但效果数据只覆盖使用该助手的客户,不能外推到全部理赔。

Uber 的 robotaxi 丢了数千件东西:无人车真正进后台了
早先只知道 Uber 首次把 robotaxi 写进年度失物指数,现在更硬的信号来了:过去 12 个月,Uber 平台上的 robotaxi 行程已经产生“数千件”遗失物。这个数字不能倒推出订单量,但足够说明 robotaxi 正从演示视频进入日常服务;车可以无人,失物招领、客服、保管和责任划分却不会自动消失。

ZeroDrift 融了 1000 万美元:企业 AI 开始给模型买刹车
ZeroDrift 获得 1000 万美元种子轮融资,投资方包括 a16z Speedrun、Reign Ventures、PitchDrive Ventures、U&I Ventures 等。它不做底层模型,而是夹在模型和用户之间,先用确定性规则识别合规风险,再让 LLM 改写回复。关键变化是,企业 AI 的预算正在从“模型更强”转向“系统可控、可审计、可追责”。

Simon Willison 做了个小原型:AI 输入框该让位给文件工作台了
Simon Willison 在 2026 年 6 月 2 日发布了 Pasted File Editor 原型,复刻 Claude.ai 和 Claude 客户端里“大段粘贴自动转附件”的交互。它的规则很小:粘贴超过 1000 字符的内容,就自动作为附件加入,编辑器正文保持不变。真正值得看的是产品方向:AI 使用的瓶颈,正在从模型能力延伸到上下文入口和文件工作流。

OpenAI不设PAC,但已经把AI监管菜单递上了桌
OpenAI发布公共政策议程,把前沿模型安全、青少年保护、深度伪造、教育就业和AI基础设施放进同一套监管主张里。它此前澄清不设PAC,说明它不想被贴上直接下场搞政治募款的标签;但这份议程也说明,OpenAI并没有退出政策场,反而在更系统地争夺规则定义权。

Alphabet要融800亿美元:AI竞赛开始向股东要弹药
Alphabet计划通过出售股票融资800亿美元,用于AI基础设施、全球算力和相关资本开支,其中100亿美元股票将出售给伯克希尔哈撒韦。真正的信号不是“Google缺钱”,而是AI军备竞赛已经贵到连现金流最强的科技巨头,也要重新计算资产负债表、股东稀释和算力供给。

OpenAI在密歇根开建1GW数据中心:算力落地,也要交地方账
OpenAI与Oracle、Related Digital、Walbridge等在密歇根州Saline开工建设The Barn,这是Stargate计划下一个规划规模1GW的数据中心园区。 更关键的是,OpenAI把项目说成就业、电费保护、低耗水、社区投资和AI教育资源的组合包,而不只是机房扩建。 这些仍是官方承诺和预期数字。接下来要看电网成本、水资源许可、岗位质量和税收流向能否对上账。

佛州起诉 OpenAI:ChatGPT 真正的麻烦,是被当成高风险产品审
佛罗里达州总检察长起诉 OpenAI 和 Sam Altman,称 ChatGPT 与暴力、自杀、未成年人安全等风险有关,并指控公司在商业竞赛中低估安全问题。最关键的变化不是“AI 是否导致枪击”这句耸动标题,而是州政府试图把 ChatGPT 从普通工具拉进产品安全和消费者保护框架。

亚马逊关停内部 AI 使用榜单:用量一旦排名,就容易变形
亚马逊关闭了一个按员工 AI 工具使用量排名的内部榜单,官方称项目已达到提升认知和采用的目标。多名员工向 404 Media 称,榜单容易被操纵,至少有人承认用无关任务抬高排名。问题不在 AI 工具有没有用,而在企业把“用得多”当成荣誉或绩效信号时,可能把采用率推成虚假用量。

超级智能恐慌:一条会吞掉聪明人的假设链
2016 年,Maciej Ceglowski 用《Superintelligence: The Idea That Eats Smart People》拆解了 Bostrom 式超级智能风险论:它不是一句“AI 会毁灭人类”,而是一串看似合理、但每一步都依赖假设的推演。最该警惕的不是讨论 AI 风险本身,而是末日叙事把资金、注意力和治理议程从现实问题上挪走。对 AI 安全研究者和科技从业者来说,关键动作不是站队恐慌或反恐慌,而是盯住哪些前提被验证、哪些只是被故事讲顺了。

WindBorne 发布 WeatherMesh 6:AI 天气预报的胜负手,可能在数据
WindBorne Systems 发布 WeatherMesh 6,称其在部分关键变量上超过 ECMWF 的传统和 AI 预报,并能每小时生成一次预报。更关键的判断是,它的优势未必主要来自模型架构,而是来自约 400 个高空气球、直接数据摄入和数据同化能力。对政府采购、航空管理、能源和大宗商品交易者来说,这不是“换一个天气 App”,而是要重新评估高频气象数据值不值得付费。

JetBrains 发布 Mellum2:代码 AI 开始从“大模型崇拜”转向系统算账
JetBrains 开源 Mellum2:12B 总参数、每 token 激活 2.5B 参数,采用 MoE 架构,面向自然语言与代码任务,Apache 2.0 许可。 它不是用来挑战 GPT-4 或 Claude 的前沿模型,更像 IDE、RAG、agent 工作流里的高频执行组件。 这件事的重点是:软件工程 AI 正在从“一个大模型包打天下”,转向更便宜、更可控、更容易私有部署的小齿轮体系。