人工智能资讯 第32页
聚合当前分类下的最新内容,按时间顺序查看第 32 页精选文章。

QKV 不是圣物,KV Cache 才是账本
ICML 2026 一篇论文系统测试 Transformer 的 Q/K/V 投影共享,发现共享 Key-Value 能把语言模型 KV cache 减半,只带来 3.1% 困惑度退化。它没有推翻三投影结构,但把注意力里的默认冗余量化了:端侧推理正在逼架构为内存账单让路。

Project Stratos削地近半,但犹他州AI数据中心的水电账还没算清
Kevin O’Leary承诺把犹他州Project Stratos数据中心用地从约4万英亩削减近半,移除约1.943万英亩,并再削减东北部近公路区域620英亩。这个让步没有达到犹他州参议院议长J. Stuart Adams提出的削减75%要求;即使缩到约2万英亩,项目仍大于曼哈顿。真正的争议还在后面:AI数据中心的土地、水、电、生态和社区成本,谁来承担、怎么约束。

ChatGPT 新记忆上线:AI 开始整理你没让它记住的事
OpenAI 开始向美国 Plus 和 Pro 用户推出基于 Dreaming 的新版 ChatGPT 记忆系统,之后会扩展到更多国家及 Free、Go 用户。 这次变化的关键,不是多存几条偏好,而是 ChatGPT 会在后台综合聊天历史,让长期上下文更连续、更及时。 对重度用户是效率红利;对平台权力来说,这是新的入口。谁掌握长期语境,谁就更容易留住工作流。

Google删掉“人在回路”:AI公司最怕写下责任
404 Media 报道 Google 员工内部分享吐槽其 AI 表现的 meme 后,Google 要求替换声明;新版本删掉了“维持人在回路中至关重要”。这不能证明 Google 取消人工审核,但说明“人工监督”这类话正在从安全承诺变成责任把手。对用户、企业客户和监管者来说,接下来该看的不是宣传里的“可信 AI”,而是企业是否愿意写清监督、申诉和追责机制。

Windows 重回 Build 开场:微软想把 AI PC 从口号拉回本地算力
微软在 Build 2026 开场把 Windows 放回核心位置,纳德拉用 Surface RTX Spark Dev Kit 吸引开发者,并称它为“dream machine”。 英伟达以 RTX Spark 芯片重返 Windows on Arm,微软和英伟达把它包装成 PC 的新起点,但现在还缺价格、性能、出货和采用度这些硬指标。 我更在意的是:Windows 是否正在从传统操作系统,转向承载本地 AI agent 和企业自有算力的平台。

Waymo载客去偷瑜伽服,真正暴露的是无人车影像取证边界
今年1月,旧金山一名窃贼乘坐Waymo无人出租车前往Hot 8 Yoga盗走瑜伽服后离开,警方至今未抓获嫌疑人。案件重点不在于“无人车帮助犯罪”,而在于车载影像保存、隐私模糊处理与执法调取之间的现实落差。它提醒城市管理者:robotaxi既不是天然的监控车,也不是完全脱离公共安全体系的普通交通工具。

WWDC 2026:Siri 要从语音按钮变成办事入口,苹果最难的一关还没过
WWDC 2026 将于太平洋时间周一上午 10 点开幕,重点预计落在 Siri 大改版、Apple Intelligence 扩展和多系统 AI 功能上。最关键的看点不是苹果补了多少模型能力,而是 Siri 能否从问答工具变成跨 App 办事入口。普通用户可以观望,开发者要盯紧代理权限、调用规则和 App Store 分成逻辑。

Meta 在 Facebook 推 AI 创作者助手:效率工具背后,是平台编辑权
Meta 在 Facebook 推出面向创作者的 AI 助手,先在美国、加拿大、印度上线,可基于账号表现、社区和目标,回答发帖时机、评论反馈、受众变化和趋势选题等问题。它不是自动写稿工具,更像把后台数据、选题建议和发布节奏做成对话入口。对创作者来说,这是省时间;对 Meta 来说,这是把内容供给更紧地留在自家生态里。

华为开源 KVarN:长上下文推理,账单卡在 KV-cache
华为 CSL 开源 KVarN,一个基于 vLLM v0.22.0 的 KV-cache 量化后端,Apache 2.0 协议,README 宣称 one flag 启用、无需校准,可把 KV-cache 容量提升 3-5 倍。更关键的是,它在披露测试中给出最高约 1.3 倍 FP16 吞吐、FP16 级准确率,并声称最高约 2.4 倍 TurboQuant 吞吐。我的判断:这不是模型能力新闻,而是长上下文和 Agent 服务开始认真清算 KV-cache 成本。

纽约法官痛斥虚假判例:AI 疑云下,律师最该怕的不是模型
5月20日,纽约州最高法院上诉庭直播中,法官质问原告律师 Michael Sanders:上诉文件里至少3个案例疑似不存在,另有10个案例被指误述法律。法官没有明说这些错误来自生成式 AI,但已要求 Sanders 及其律所说明为何不应受制裁。真正刺痛人的地方,是对方律师也没发现;专业行业一旦把核查交给工具、流程和侥幸,职业信任就会被低成本自动化慢慢磨掉。

Google 的 75% AI 代码,卡在了人类评审那里
Google CEO Sundar Pichai 对外称,公司 75% 的新代码由 AI 生成;但内部员工正在 Memegen 上大量吐槽自家 AI 编程工具 Jetski。真正的问题不是 AI 会不会写代码,而是“生成”被算成生产力后,验证、审查、测试和维护成本被推给了一线工程流程。

EVA-Bench 2.0 发布:语音 Agent 该从演示视频回到企业流程了
ServiceNow-AI 在 Hugging Face 发布 EVA-Bench Data 2.0,覆盖航空客服、企业 IT 服务、医疗 HR 三个领域,合计 213 个场景、121 个工具、35+ 工作流。它的价值不在制造一个新榜单,而在把语音 Agent 放进认证、权限、政策和不可满足请求里测试。对企业 AI 团队和 Agent 产品负责人来说,这更像一套上线前的流程压力测试清单。

AI 内容都贴标签了,为什么还不让用户一键屏蔽?
The Verge 批评 YouTube、Instagram、TikTok、Meta、Spotify 等平台已经在给 AI 生成内容打标签,却没有给用户按标签过滤、隐藏或降权的开关。问题不在识别技术,而在平台不愿把选择权交给用户,因为那会直接检验 AI 内容在推荐流里到底有多少真实需求。

NVIDIA 的合成数据实验:造题只是表面,管题才是门槛
NVIDIA 在 Hugging Face 发布 Nemotron 预训练用的 task-seeded 合成 Q&A 数据流程:用公开任务训练集做种子,生成新问题、答案、推理和上下文。它在 Nemotron-3 Nano 的 100B token 继续训练实验中带来部分基准提升,但数学平均基本稳定。真正该看的不是“合成数据有没有用”,而是预训练竞争正在从拼语料规模,转向拼数据结构、验证能力和训练配比。

Endava 把 OpenAI 接进交付流程:软件服务公司的旧算盘松了
Endava 正在把 ChatGPT Enterprise、Codex 和 OpenAI 技术嵌入 DavaFlow,从会议准备、产品发现到软件工程、部署和运营流程都覆盖到。重点不是“企业用了 AI”,而是技术服务公司的交付模式开始从堆人、堆流程,转向人机协同编排。对技术管理者和项目负责人来说,下一步要看的不是账号开了多少,而是需求、治理、协同和激励有没有跟着改。

亚马逊仓库机器人能听人话了,但重点是系统更会管人了
亚马逊发布新一代全自主仓储机器人 Proteus,重点升级是 AI 自然语言交互:员工不再必须用专用软件,可像给同事派活一样下达搬运任务。 新 Proteus 仍在亚马逊实验室试点,计划 2027 年上半年先在欧洲部署;亚马逊称它可走出 dock 区域,在更大仓库范围内搬运容器、衔接工位、辅助配送站点。 这不是“机器人会聊天”的热闹功能,而是仓库调度权继续向系统集中。效率账更清楚,岗位替代和劳动节拍的账还没结完。

伯克利部分 CS 课程挂科上升:AI 没法背全锅,但正在放大基础缺口
UC Berkeley 部分计算机相关课程出现不及格成绩上升,授课教师把它同学生更频繁使用 AI 工具、数学基础变弱联系起来。现在还不能说 AI 直接导致挂科,更稳妥的判断是:AI 让学生更容易跳过训练过程,也让原本的基础能力差距更早暴露。对高校教师和课程设计者来说,难题不是简单禁用 AI,而是重新验证学生到底会不会推理、调试和证明。

大模型“由权重构成”:一篇科幻仿作为什么戳中记忆与责任问题
Max Leiter 的《Weights》是对 Terry Bisson《它们是由肉做成的》的文学仿写,不是技术论文,也不是“大模型已有意识”的声明。它真正刺到人的地方,是把大模型写成“由浮点权重和矩阵乘法构成”的存在,反问我们还能不能用“只是模式匹配”绕开经验、记忆和责任。下一代模型开始加入跨会话记忆后,这个问题已经从科幻玩笑进入产品治理。

Wasmer 两周做出 Edge.js:Codex 是工程杠杆,还是提速叙事
Wasmer 称借助 OpenAI Codex,用两周做出 Edge.js,让 Node.js 工作负载可在 WebAssembly 沙箱和边缘层运行,不依赖 Docker。 这件事的重点不是 AI 多写了几行代码,而是 Codex 被用到架构、查 bug、根因定位和 C++/汇编层调试。 两周、一年、10x 到 20x 都来自 Wasmer 自述。对团队更有用的判断是:先做验证,不要直接把它当成成熟迁移路线。

Ted Chiang反驳AI意识论:Claude会说“我”,不等于它有感受
Ted Chiang在《大西洋月刊》发文,反驳把大语言模型的语言表现当成意识、情感和道德主体的说法。争议焦点不是Anthropic是否宣布Claude有意识,而是它在Claude“constitution”文件和公开表述中使用了大量近似主体的语言。对AI伦理研究者和科技从业者来说,真正要做的是把研究假设、产品说明和用户界面分开,避免把系统行为写成内心生活。

GPT-Rosalind 更新:OpenAI 想进生命科学的实验流程,但硬门槛不是跑分
OpenAI 更新 GPT-Rosalind,把 GPT-5.5 的工具调用、代码能力和生命科学专项能力接入药物化学、基因组学、湿实验排错和科研插件工作流。它现在以 research preview 面向合格机构开放,不是全面商用发布。真正该看的不是 benchmark 涨了多少,而是 AI 正在逼近科研流程中间层;但能不能被审计、复现、追责,仍是硬门槛。