人工智能资讯第32页

人工智能 2026/6/5

QKV 不是圣物，KV Cache 才是账本

ICML 2026 一篇论文系统测试 Transformer 的 Q/K/V 投影共享，发现共享 Key-Value 能把语言模型 KV cache 减半，只带来 3.1% 困惑度退化。它没有推翻三投影结构，但把注意力里的默认冗余量化了：端侧推理正在逼架构为内存账单让路。

TransformerKV CacheQKV 投影共享

人工智能 2026/6/5

Project Stratos削地近半，但犹他州AI数据中心的水电账还没算清

Kevin O’Leary承诺把犹他州Project Stratos数据中心用地从约4万英亩削减近半，移除约1.943万英亩，并再削减东北部近公路区域620英亩。这个让步没有达到犹他州参议院议长J. Stuart Adams提出的削减75%要求；即使缩到约2万英亩，项目仍大于曼哈顿。真正的争议还在后面：AI数据中心的土地、水、电、生态和社区成本，谁来承担、怎么约束。

Project StratosAI数据中心Kevin O’Leary

人工智能 2026/6/5

ChatGPT 新记忆上线：AI 开始整理你没让它记住的事

OpenAI 开始向美国 Plus 和 Pro 用户推出基于 Dreaming 的新版 ChatGPT 记忆系统，之后会扩展到更多国家及 Free、Go 用户。这次变化的关键，不是多存几条偏好，而是 ChatGPT 会在后台综合聊天历史，让长期上下文更连续、更及时。对重度用户是效率红利；对平台权力来说，这是新的入口。谁掌握长期语境，谁就更容易留住工作流。

ChatGPTOpenAIDreaming

人工智能 2026/6/5

Google删掉“人在回路”：AI公司最怕写下责任

404 Media 报道 Google 员工内部分享吐槽其 AI 表现的 meme 后，Google 要求替换声明；新版本删掉了“维持人在回路中至关重要”。这不能证明 Google 取消人工审核，但说明“人工监督”这类话正在从安全承诺变成责任把手。对用户、企业客户和监管者来说，接下来该看的不是宣传里的“可信 AI”，而是企业是否愿意写清监督、申诉和追责机制。

AI责任人在回路中Google

人工智能 2026/6/5

Windows 重回 Build 开场：微软想把 AI PC 从口号拉回本地算力

微软在 Build 2026 开场把 Windows 放回核心位置，纳德拉用 Surface RTX Spark Dev Kit 吸引开发者，并称它为“dream machine”。英伟达以 RTX Spark 芯片重返 Windows on Arm，微软和英伟达把它包装成 PC 的新起点，但现在还缺价格、性能、出货和采用度这些硬指标。我更在意的是：Windows 是否正在从传统操作系统，转向承载本地 AI agent 和企业自有算力的平台。

本地 AI PCWindows微软

人工智能 2026/6/5

Waymo载客去偷瑜伽服，真正暴露的是无人车影像取证边界

今年1月，旧金山一名窃贼乘坐Waymo无人出租车前往Hot 8 Yoga盗走瑜伽服后离开，警方至今未抓获嫌疑人。案件重点不在于“无人车帮助犯罪”，而在于车载影像保存、隐私模糊处理与执法调取之间的现实落差。它提醒城市管理者：robotaxi既不是天然的监控车，也不是完全脱离公共安全体系的普通交通工具。

Waymo无人出租车robotaxi

人工智能 2026/6/5

WWDC 2026：Siri 要从语音按钮变成办事入口，苹果最难的一关还没过

WWDC 2026 将于太平洋时间周一上午 10 点开幕，重点预计落在 Siri 大改版、Apple Intelligence 扩展和多系统 AI 功能上。最关键的看点不是苹果补了多少模型能力，而是 Siri 能否从问答工具变成跨 App 办事入口。普通用户可以观望，开发者要盯紧代理权限、调用规则和 App Store 分成逻辑。

SiriApple IntelligenceWWDC 2026

人工智能 2026/6/5

Meta 在 Facebook 推 AI 创作者助手：效率工具背后，是平台编辑权

Meta 在 Facebook 推出面向创作者的 AI 助手，先在美国、加拿大、印度上线，可基于账号表现、社区和目标，回答发帖时机、评论反馈、受众变化和趋势选题等问题。它不是自动写稿工具，更像把后台数据、选题建议和发布节奏做成对话入口。对创作者来说，这是省时间；对 Meta 来说，这是把内容供给更紧地留在自家生态里。

MetaFacebookAI 创作者助手

人工智能 2026/6/5

华为开源 KVarN：长上下文推理，账单卡在 KV-cache

华为 CSL 开源 KVarN，一个基于 vLLM v0.22.0 的 KV-cache 量化后端，Apache 2.0 协议，README 宣称 one flag 启用、无需校准，可把 KV-cache 容量提升 3-5 倍。更关键的是，它在披露测试中给出最高约 1.3 倍 FP16 吞吐、FP16 级准确率，并声称最高约 2.4 倍 TurboQuant 吞吐。我的判断：这不是模型能力新闻，而是长上下文和 Agent 服务开始认真清算 KV-cache 成本。

KVarNKV-cache华为 CSL

人工智能 2026/6/4

纽约法官痛斥虚假判例：AI 疑云下，律师最该怕的不是模型

5月20日，纽约州最高法院上诉庭直播中，法官质问原告律师 Michael Sanders：上诉文件里至少3个案例疑似不存在，另有10个案例被指误述法律。法官没有明说这些错误来自生成式 AI，但已要求 Sanders 及其律所说明为何不应受制裁。真正刺痛人的地方，是对方律师也没发现；专业行业一旦把核查交给工具、流程和侥幸，职业信任就会被低成本自动化慢慢磨掉。

AI幻觉法律行业虚构判例

人工智能 2026/6/4

Google 的 75% AI 代码，卡在了人类评审那里

Google CEO Sundar Pichai 对外称，公司 75% 的新代码由 AI 生成；但内部员工正在 Memegen 上大量吐槽自家 AI 编程工具 Jetski。真正的问题不是 AI 会不会写代码，而是“生成”被算成生产力后，验证、审查、测试和维护成本被推给了一线工程流程。

AI 生成代码GoogleSundar Pichai

人工智能 2026/6/4

EVA-Bench 2.0 发布：语音 Agent 该从演示视频回到企业流程了

ServiceNow-AI 在 Hugging Face 发布 EVA-Bench Data 2.0，覆盖航空客服、企业 IT 服务、医疗 HR 三个领域，合计 213 个场景、121 个工具、35+ 工作流。它的价值不在制造一个新榜单，而在把语音 Agent 放进认证、权限、政策和不可满足请求里测试。对企业 AI 团队和 Agent 产品负责人来说，这更像一套上线前的流程压力测试清单。

语音 AgentEVA-Bench 2.0ServiceNow-AI

人工智能 2026/6/4

AI 内容都贴标签了，为什么还不让用户一键屏蔽？

The Verge 批评 YouTube、Instagram、TikTok、Meta、Spotify 等平台已经在给 AI 生成内容打标签，却没有给用户按标签过滤、隐藏或降权的开关。问题不在识别技术，而在平台不愿把选择权交给用户，因为那会直接检验 AI 内容在推荐流里到底有多少真实需求。

AI生成内容内容标签内容过滤

人工智能 2026/6/4

NVIDIA 的合成数据实验：造题只是表面，管题才是门槛

NVIDIA 在 Hugging Face 发布 Nemotron 预训练用的 task-seeded 合成 Q&A 数据流程：用公开任务训练集做种子，生成新问题、答案、推理和上下文。它在 Nemotron-3 Nano 的 100B token 继续训练实验中带来部分基准提升，但数学平均基本稳定。真正该看的不是“合成数据有没有用”，而是预训练竞争正在从拼语料规模，转向拼数据结构、验证能力和训练配比。

NVIDIANemotron合成数据

人工智能 2026/6/4

Endava 把 OpenAI 接进交付流程：软件服务公司的旧算盘松了

Endava 正在把 ChatGPT Enterprise、Codex 和 OpenAI 技术嵌入 DavaFlow，从会议准备、产品发现到软件工程、部署和运营流程都覆盖到。重点不是“企业用了 AI”，而是技术服务公司的交付模式开始从堆人、堆流程，转向人机协同编排。对技术管理者和项目负责人来说，下一步要看的不是账号开了多少，而是需求、治理、协同和激励有没有跟着改。

EndavaOpenAI企业级 AI 平台

人工智能 2026/6/4

亚马逊仓库机器人能听人话了，但重点是系统更会管人了

亚马逊发布新一代全自主仓储机器人 Proteus，重点升级是 AI 自然语言交互：员工不再必须用专用软件，可像给同事派活一样下达搬运任务。新 Proteus 仍在亚马逊实验室试点，计划 2027 年上半年先在欧洲部署；亚马逊称它可走出 dock 区域，在更大仓库范围内搬运容器、衔接工位、辅助配送站点。这不是“机器人会聊天”的热闹功能，而是仓库调度权继续向系统集中。效率账更清楚，岗位替代和劳动节拍的账还没结完。

亚马逊Proteus仓储机器人

人工智能 2026/6/4

伯克利部分 CS 课程挂科上升：AI 没法背全锅，但正在放大基础缺口

UC Berkeley 部分计算机相关课程出现不及格成绩上升，授课教师把它同学生更频繁使用 AI 工具、数学基础变弱联系起来。现在还不能说 AI 直接导致挂科，更稳妥的判断是：AI 让学生更容易跳过训练过程，也让原本的基础能力差距更早暴露。对高校教师和课程设计者来说，难题不是简单禁用 AI，而是重新验证学生到底会不会推理、调试和证明。

生成式 AIAI 工具加州大学伯克利

人工智能 2026/6/4

大模型“由权重构成”：一篇科幻仿作为什么戳中记忆与责任问题

Max Leiter 的《Weights》是对 Terry Bisson《它们是由肉做成的》的文学仿写，不是技术论文，也不是“大模型已有意识”的声明。它真正刺到人的地方，是把大模型写成“由浮点权重和矩阵乘法构成”的存在，反问我们还能不能用“只是模式匹配”绕开经验、记忆和责任。下一代模型开始加入跨会话记忆后，这个问题已经从科幻玩笑进入产品治理。

大模型AI伦理Weights

人工智能 2026/6/4

Wasmer 两周做出 Edge.js：Codex 是工程杠杆，还是提速叙事

Wasmer 称借助 OpenAI Codex，用两周做出 Edge.js，让 Node.js 工作负载可在 WebAssembly 沙箱和边缘层运行，不依赖 Docker。这件事的重点不是 AI 多写了几行代码，而是 Codex 被用到架构、查 bug、根因定位和 C++/汇编层调试。两周、一年、10x 到 20x 都来自 Wasmer 自述。对团队更有用的判断是：先做验证，不要直接把它当成成熟迁移路线。

OpenAI CodexWasmerEdge.js

人工智能 2026/6/4

Ted Chiang反驳AI意识论：Claude会说“我”，不等于它有感受

Ted Chiang在《大西洋月刊》发文，反驳把大语言模型的语言表现当成意识、情感和道德主体的说法。争议焦点不是Anthropic是否宣布Claude有意识，而是它在Claude“constitution”文件和公开表述中使用了大量近似主体的语言。对AI伦理研究者和科技从业者来说，真正要做的是把研究假设、产品说明和用户界面分开，避免把系统行为写成内心生活。

AI意识论Ted ChiangClaude

人工智能 2026/6/4

GPT-Rosalind 更新：OpenAI 想进生命科学的实验流程，但硬门槛不是跑分

OpenAI 更新 GPT-Rosalind，把 GPT-5.5 的工具调用、代码能力和生命科学专项能力接入药物化学、基因组学、湿实验排错和科研插件工作流。它现在以 research preview 面向合格机构开放，不是全面商用发布。真正该看的不是 benchmark 涨了多少，而是 AI 正在逼近科研流程中间层；但能不能被审计、复现、追责，仍是硬门槛。

OpenAIGPT-Rosalind生命科学

人工智能资讯 第32页

QKV 不是圣物，KV Cache 才是账本

Project Stratos削地近半，但犹他州AI数据中心的水电账还没算清

ChatGPT 新记忆上线：AI 开始整理你没让它记住的事

Google删掉“人在回路”：AI公司最怕写下责任

Windows 重回 Build 开场：微软想把 AI PC 从口号拉回本地算力

Waymo载客去偷瑜伽服，真正暴露的是无人车影像取证边界

WWDC 2026：Siri 要从语音按钮变成办事入口，苹果最难的一关还没过

Meta 在 Facebook 推 AI 创作者助手：效率工具背后，是平台编辑权

华为开源 KVarN：长上下文推理，账单卡在 KV-cache

纽约法官痛斥虚假判例：AI 疑云下，律师最该怕的不是模型

Google 的 75% AI 代码，卡在了人类评审那里

EVA-Bench 2.0 发布：语音 Agent 该从演示视频回到企业流程了

AI 内容都贴标签了，为什么还不让用户一键屏蔽？

NVIDIA 的合成数据实验：造题只是表面，管题才是门槛

Endava 把 OpenAI 接进交付流程：软件服务公司的旧算盘松了

亚马逊仓库机器人能听人话了，但重点是系统更会管人了

伯克利部分 CS 课程挂科上升：AI 没法背全锅，但正在放大基础缺口

大模型“由权重构成”：一篇科幻仿作为什么戳中记忆与责任问题

Wasmer 两周做出 Edge.js：Codex 是工程杠杆，还是提速叙事

Ted Chiang反驳AI意识论：Claude会说“我”，不等于它有感受

GPT-Rosalind 更新：OpenAI 想进生命科学的实验流程，但硬门槛不是跑分

人工智能资讯第32页