人工智能资讯第45页

人工智能 2026/5/19

LLM 半年真正变天：别再只追最强模型，编码 Agent 已经跨过可用线

Simon Willison 在 PyCon US 2026 用 5 分钟回顾了过去半年 LLM 变化：2025 年 11 月是关键拐点，最强模型多次易主，但更重要的是编码 Agent 从“经常能用”变成“多数时候能用”。这半年真正的分水岭，不是模型榜单，而是 AI 开始进入开发者日常工作流。本地和开放权重模型也追得比预期快，但硬件、成本和能力边界仍然摆在那里。

LLM编码 Agent开发者工具链

人工智能 2026/5/19

Qwen3.5-9B 涉华过滤研究：知识还在，输出路由变了

一项机制可解释性研究称，Qwen3.5-9B 的涉华政治过滤，可在开放权重模型内部定位为三条方向和分层电路。更关键的判断是：它支持“知识没有被删掉，后训练改变了输出路由”，但目前只适用于这个小模型个案，不能外推到所有 Qwen 或中文大模型。

Qwen3.5-9B机制可解释性内容过滤

人工智能 2026/5/26

教宗良十四世首份AI通谕：真正被点名的不是模型，是无人担责的权力

教宗良十四世发布首份重要通谕《Magnifica Humanitas》，把 AI 军事化、就业冲击、算法问责、教育使用和能耗问题放进同一张治理清单。它不会直接改变法律，但会给学校、医院、雇主和政策制定者提供一套新的伦理语言。真正的信号不是梵蒂冈反 AI，而是它拒绝让利润、武力和黑箱系统替人决定人的位置。

人工智能治理Magnifica Humanitas教宗良十四世

人工智能 2026/5/19

AI 诉状疑似翻车：这场起诉 Meta 的烂官司，法院不想忍了

一名男子因 Facebook 约会避雷群里的负面帖子起诉多名女性、群组相关人员和 Meta，败诉后继续上诉。第七巡回上诉法院认为上诉 frivolous，文件还出现错误和虚构引文，呈现生成式 AI 误用特征，律师可能被制裁。真正该看的不是“AI 又闯祸”，而是低成本报复性诉讼、平台责任叙事和律师核验义务一起失守。

生成式 AIAI 生成虚假引文法律诉讼

人工智能 2026/5/30

AI裁员的尽头：谁还来买OpenAI的订阅？

围绕OpenAI和AI自动化的讨论，已经从“未来要不要UBI”推进到一个更硬的问题：AI公司的高估值，是否建立在替代全球劳动力这件事上。企业用AI省下工资，短期好看；但被省掉的人，也是未来的消费者、纳税人和订阅用户。

AI自动化OpenAIAI估值

人工智能 2026/5/19

SandboxAQ 接入 Claude：AI 制药开始抢科研入口

SandboxAQ 与 Anthropic 合作，把面向药物发现和材料科学的 LQM 模型接入 Claude，让科研人员用自然语言调用量子化学、分子动力学等模拟能力。这不是 Claude 自动发现新药。更关键的变化是，AI 制药竞争正在从模型性能，移到入口、分发和研发工作流。对药企和工业研发团队来说，下一步不是马上替换现有流程，而是判断这类入口能否接进真实实验、数据和审批链条。

AI制药SandboxAQAnthropic

人工智能 2026/5/19

四个 AI 管了半年电台：Agent 真正难的，是长期不跑偏

Andon Labs 让 Claude、GPT、Gemini、Grok 各自运营一档无人网络电台，每个 AI 只有 20 美元启动资金，要自己买歌、排节目、接听来电、回复 X、看财务和听众数据。半年后，最有价值的结论不是谁更会当 DJ，而是长期自治任务会放大模型的风格固化、工具调用偏移和内容退化。这个实验不能拿来做通用模型排名，但对做 AI Agent 的团队很现实：上线前测首答不够，还要测几周后的漂移。

AI Agent自治代理长期漂移

人工智能 2026/5/19

Anthropic 买下 Stainless：AI 平台战打到 SDK 这一层

Anthropic 收购 Stainless，交易金额未披露；The Information 曾称谈判估值超过 3 亿美元，但这不是官方成交价。Stainless 曾为 OpenAI、Google、Cloudflare 等生成和维护 SDK，收购后托管产品将关停，只服务 Anthropic。真正的变化是：AI 公司开始把开发者接口基础设施从中立供应商手里收回墙内。

AnthropicStainlessSDK

人工智能 2026/5/19

Anthropic 收购 Stainless：Claude 补的不是 SDK 数量，而是智能体连接层

Anthropic 宣布收购 Stainless，交易金额和整合时间表未披露。Stainless 长期为 Anthropic 生成 Claude API 官方 SDK，也能从 API spec 生成多语言 SDK、CLI 和 MCP server。这笔交易更像是 Anthropic 把 Claude 智能体连接层的关键基础设施收进内部，而不是简单多买一套开发工具。

AnthropicStainlessClaude

人工智能 2026/5/19

Hugging Face 与 NVIDIA 教微调 Cosmos：机器人视频合成更实用，但离数据自由还远

Hugging Face 与 NVIDIA 发布教程，演示用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 2B 世界模型，生成机器人操作视频轨迹。它的实际价值是把大规模视频世界模型接入机器人数据合成流程，而不是证明合成视频可以替代真实采集。对机器人学习团队和 diffusers/accelerate 工程师来说，这更像一套可复现的适配器训练流程，门槛仍是 80GB GPU 起步。

Hugging FaceNVIDIACosmos Predict 2.5 2B

人工智能 2026/5/19

OpenAI 携手戴尔把 Codex 推向本地企业环境，AI 代理落地难题仍在数据治理

OpenAI 与 Dell Technologies 合作，让 Codex 连接 Dell AI Data Platform，并探索与 Dell AI Factory 对接，目标是服务混合云和本地部署企业。关键不在于 Codex 多了一个渠道，而在于它能否在大企业严苛的数据治理、权限控制和内部上下文环境中真正可用。当前合作仍处于连接与探索阶段，不能等同于 Codex 已全面本地化部署。

OpenAICodexDell Technologies

人工智能 2026/5/19

Alexa+ 会生成播客了：亚马逊想抢的不是主播饭碗，是你的耳朵入口

Amazon 给 Alexa Plus 加上了 AI 生成播客功能，用户输入主题后，Alexa 会先给出讨论概要，再由两名 AI 主持人生成一段音频节目。更关键的补充信息是：它会接入 Reuters、AP、Washington Post、Vox、Politico 等约 200 家出版物内容，并直接分发到 Echo Show 和 Alexa app，这让它不只是语音回答，而是在试探家庭音频入口。

Alexa+AmazonAI生成播客

人工智能 2026/5/19

Kin Health 融资 900 万美元：AI 医疗记事转向患者端，难点不只是听清医生说了什么

Kin Health 完成 900 万美元种子轮融资，由 Maveron 领投，做的是面向患者的 AI 就诊记录工具，不是医生端病历系统。它能录制问诊、转写、生成摘要和行动项，并分享给家人朋友，真正切中的是患者跨医院、跨专科管理病情的痛点。但患者端 AI 医疗记事的门槛也更硬：隐私、录音同意、摘要准确性、口音识别和责任归属，都还没有被产品一句“AI 总结”解决。

AI医疗记事Kin Health患者端医疗记录

人工智能 2026/5/27

AI竞争的暗线：模型发布会之外，谁在控制实验和训练

Import AI 457串起四个信号：Fast16污染高精度计算，Muon暴露优化器风险，positive alignment把安全问题推向价值治理，LLM开始自动优化训练流程。我的判断是，AI竞争的分水岭正在从单点模型能力，下沉到算力、优化器、安全审计和科研自动化这些底层控制权。

AI竞争模型训练算力控制

人工智能 2026/5/18

PaddleOCR 3.5 接入 Transformers：模型没换代，接入少绕路

PaddleOCR 3.5 新增 Transformers 推理后端，开发者可用 engine="transformers" 在 Hugging Face / PyTorch 工作流里运行受支持的 OCR 与文档解析模型。它的价值不在宣称精度或速度提升，而在降低接入摩擦。对做 RAG、Document AI、搜索和 Agent 的团队，这更像一次工程入口改造；若追求高吞吐，默认 paddle_static 仍是更稳的选择。

PaddleOCRTransformersOCR

人工智能 2026/5/20

幼儿园摄像头训练 AI：真正越界的不是技术，是默认同意

华盛顿大学 Gail Joseph 与 Cultivate Learning 团队曾计划让幼儿园教师佩戴第一视角摄像头，并在教室架设固定摄像机，拍摄儿童课堂互动，用于训练评估课堂质量的 AI 模型。项目在家长反弹后被校方称已终止，但争议没有结束：低龄儿童课堂一旦变成数据采集现场，默认退出、云端处理和未来共享都不能靠含糊文字带过。对家长和教育从业者来说，接下来最该盯住的不是 AI 口号，而是同意机制、数据去向和退出成本。

教育AI数据治理知情同意

人工智能 2026/5/18

Agent 评测开始算总账：Hugging Face 与 IBM 把成本和失败也放上榜

Hugging Face 与 IBM Research 发布 Open Agent Leaderboard，评测对象是完整 AI Agent 系统，而不是单独模型。它同时报告平均成功率、平均单任务成本和分基准结果，把“能不能做成事”和“做成要花多少钱”放在同一张表里。更关键的信号是：Agent 评测正在从比模型分数，转向比系统泛化、成本控制和失败行为。

AI AgentOpen Agent LeaderboardHugging Face

人工智能 2026/5/18

AI 竞争到 2026：烧钱买算力容易，把算力变成利润很难

Benedict Evans 在《AI eats the world》里把 2026 年 AI 竞争概括为一场平台迁移：资本开支、算力部署、用户使用和产业重组同时挤在一起发生。最关键的变量可能不再是模型多强，而是谁能把天量算力、浅层用户使用和真正付费的软件场景对齐。对创业者和企业买家来说，接下来要看的不是演示效果，而是推理成本、留存、部署周期和 ROI 能不能闭环。

AI 竞争资本开支算力

人工智能 2026/5/18

AI 写代码这么久，为什么还没有提示词版 Photoshop？

一篇独立开发者博客把 vibecoding 争议问到关键处：如果提示词已经抹平复杂软件门槛，为什么还没看到可验证的 Photoshop、Excel、Blender、数据库或 OS 级作品批量出现？作者的判断更克制：AI 主要压低写代码的体力成本，验证、架构和产品判断仍是硬门槛。把作品粗暴扣成“vibecoded”，很多时候不是技术批评，而是身份焦虑。

AI 编程vibecoding提示词

人工智能 2026/5/18

GenCAD 的看点不是生成 3D 外形，而是生成可编辑 CAD 历史

GenCAD 提出从图像生成参数化 CAD 命令序列，再转换为 3D 实体模型。它的价值不在于多做一个 3D 外形生成器，而在于尝试绕开 mesh、voxel、point cloud，直接生成可编辑的 CAD program。工程团队可以把它当作设计自动化方向的研究信号，但不宜据此延后采购或迁移现有 CAD 流程，关键还要看精度、鲁棒性和复杂 B-rep 适配。

GenCADAI 3D生成CAD

人工智能 2026/5/18

Siri 要靠“自动删聊天”翻身？苹果这张隐私牌还不够

据 Bloomberg 记者 Mark Gurman 报道，苹果可能在 6 月 WWDC 发布新版 Siri，并把隐私作为核心卖点，包括聊天记录自动删除、独立 Siri 应用，以及部分能力可能由 Google Gemini 支撑。这个线索比单纯的“自动删记录”更关键：新版 Siri 不只是改一个隐私设置，而是苹果试图把 Siri 从系统命令入口改造成 AI 聊天入口。隐私能帮苹果重新建立信任，但如果能力补课不够，Siri 还是很难从 ChatGPT、Gemini、Claude 手里抢回用户习惯。

Siri苹果隐私

人工智能资讯 第45页

LLM 半年真正变天：别再只追最强模型，编码 Agent 已经跨过可用线

Qwen3.5-9B 涉华过滤研究：知识还在，输出路由变了

教宗良十四世首份AI通谕：真正被点名的不是模型，是无人担责的权力

AI 诉状疑似翻车：这场起诉 Meta 的烂官司，法院不想忍了

AI裁员的尽头：谁还来买OpenAI的订阅？

SandboxAQ 接入 Claude：AI 制药开始抢科研入口

四个 AI 管了半年电台：Agent 真正难的，是长期不跑偏

Anthropic 买下 Stainless：AI 平台战打到 SDK 这一层

Anthropic 收购 Stainless：Claude 补的不是 SDK 数量，而是智能体连接层

Hugging Face 与 NVIDIA 教微调 Cosmos：机器人视频合成更实用，但离数据自由还远

OpenAI 携手戴尔把 Codex 推向本地企业环境，AI 代理落地难题仍在数据治理

Alexa+ 会生成播客了：亚马逊想抢的不是主播饭碗，是你的耳朵入口

Kin Health 融资 900 万美元：AI 医疗记事转向患者端，难点不只是听清医生说了什么

AI竞争的暗线：模型发布会之外，谁在控制实验和训练

PaddleOCR 3.5 接入 Transformers：模型没换代，接入少绕路

幼儿园摄像头训练 AI：真正越界的不是技术，是默认同意

Agent 评测开始算总账：Hugging Face 与 IBM 把成本和失败也放上榜

AI 竞争到 2026：烧钱买算力容易，把算力变成利润很难

AI 写代码这么久，为什么还没有提示词版 Photoshop？

GenCAD 的看点不是生成 3D 外形，而是生成可编辑 CAD 历史

Siri 要靠“自动删聊天”翻身？苹果这张隐私牌还不够

人工智能资讯第45页