人工智能资讯 第45页
聚合当前分类下的最新内容,按时间顺序查看第 45 页精选文章。

LLM 半年真正变天:别再只追最强模型,编码 Agent 已经跨过可用线
Simon Willison 在 PyCon US 2026 用 5 分钟回顾了过去半年 LLM 变化:2025 年 11 月是关键拐点,最强模型多次易主,但更重要的是编码 Agent 从“经常能用”变成“多数时候能用”。这半年真正的分水岭,不是模型榜单,而是 AI 开始进入开发者日常工作流。本地和开放权重模型也追得比预期快,但硬件、成本和能力边界仍然摆在那里。

Qwen3.5-9B 涉华过滤研究:知识还在,输出路由变了
一项机制可解释性研究称,Qwen3.5-9B 的涉华政治过滤,可在开放权重模型内部定位为三条方向和分层电路。更关键的判断是:它支持“知识没有被删掉,后训练改变了输出路由”,但目前只适用于这个小模型个案,不能外推到所有 Qwen 或中文大模型。

教宗良十四世首份AI通谕:真正被点名的不是模型,是无人担责的权力
教宗良十四世发布首份重要通谕《Magnifica Humanitas》,把 AI 军事化、就业冲击、算法问责、教育使用和能耗问题放进同一张治理清单。它不会直接改变法律,但会给学校、医院、雇主和政策制定者提供一套新的伦理语言。真正的信号不是梵蒂冈反 AI,而是它拒绝让利润、武力和黑箱系统替人决定人的位置。

AI 诉状疑似翻车:这场起诉 Meta 的烂官司,法院不想忍了
一名男子因 Facebook 约会避雷群里的负面帖子起诉多名女性、群组相关人员和 Meta,败诉后继续上诉。第七巡回上诉法院认为上诉 frivolous,文件还出现错误和虚构引文,呈现生成式 AI 误用特征,律师可能被制裁。真正该看的不是“AI 又闯祸”,而是低成本报复性诉讼、平台责任叙事和律师核验义务一起失守。

AI裁员的尽头:谁还来买OpenAI的订阅?
围绕OpenAI和AI自动化的讨论,已经从“未来要不要UBI”推进到一个更硬的问题:AI公司的高估值,是否建立在替代全球劳动力这件事上。企业用AI省下工资,短期好看;但被省掉的人,也是未来的消费者、纳税人和订阅用户。

SandboxAQ 接入 Claude:AI 制药开始抢科研入口
SandboxAQ 与 Anthropic 合作,把面向药物发现和材料科学的 LQM 模型接入 Claude,让科研人员用自然语言调用量子化学、分子动力学等模拟能力。 这不是 Claude 自动发现新药。更关键的变化是,AI 制药竞争正在从模型性能,移到入口、分发和研发工作流。 对药企和工业研发团队来说,下一步不是马上替换现有流程,而是判断这类入口能否接进真实实验、数据和审批链条。

四个 AI 管了半年电台:Agent 真正难的,是长期不跑偏
Andon Labs 让 Claude、GPT、Gemini、Grok 各自运营一档无人网络电台,每个 AI 只有 20 美元启动资金,要自己买歌、排节目、接听来电、回复 X、看财务和听众数据。半年后,最有价值的结论不是谁更会当 DJ,而是长期自治任务会放大模型的风格固化、工具调用偏移和内容退化。这个实验不能拿来做通用模型排名,但对做 AI Agent 的团队很现实:上线前测首答不够,还要测几周后的漂移。

Anthropic 买下 Stainless:AI 平台战打到 SDK 这一层
Anthropic 收购 Stainless,交易金额未披露;The Information 曾称谈判估值超过 3 亿美元,但这不是官方成交价。Stainless 曾为 OpenAI、Google、Cloudflare 等生成和维护 SDK,收购后托管产品将关停,只服务 Anthropic。真正的变化是:AI 公司开始把开发者接口基础设施从中立供应商手里收回墙内。

Anthropic 收购 Stainless:Claude 补的不是 SDK 数量,而是智能体连接层
Anthropic 宣布收购 Stainless,交易金额和整合时间表未披露。Stainless 长期为 Anthropic 生成 Claude API 官方 SDK,也能从 API spec 生成多语言 SDK、CLI 和 MCP server。这笔交易更像是 Anthropic 把 Claude 智能体连接层的关键基础设施收进内部,而不是简单多买一套开发工具。

Hugging Face 与 NVIDIA 教微调 Cosmos:机器人视频合成更实用,但离数据自由还远
Hugging Face 与 NVIDIA 发布教程,演示用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 2B 世界模型,生成机器人操作视频轨迹。 它的实际价值是把大规模视频世界模型接入机器人数据合成流程,而不是证明合成视频可以替代真实采集。 对机器人学习团队和 diffusers/accelerate 工程师来说,这更像一套可复现的适配器训练流程,门槛仍是 80GB GPU 起步。

OpenAI 携手戴尔把 Codex 推向本地企业环境,AI 代理落地难题仍在数据治理
OpenAI 与 Dell Technologies 合作,让 Codex 连接 Dell AI Data Platform,并探索与 Dell AI Factory 对接,目标是服务混合云和本地部署企业。关键不在于 Codex 多了一个渠道,而在于它能否在大企业严苛的数据治理、权限控制和内部上下文环境中真正可用。当前合作仍处于连接与探索阶段,不能等同于 Codex 已全面本地化部署。

Alexa+ 会生成播客了:亚马逊想抢的不是主播饭碗,是你的耳朵入口
Amazon 给 Alexa Plus 加上了 AI 生成播客功能,用户输入主题后,Alexa 会先给出讨论概要,再由两名 AI 主持人生成一段音频节目。更关键的补充信息是:它会接入 Reuters、AP、Washington Post、Vox、Politico 等约 200 家出版物内容,并直接分发到 Echo Show 和 Alexa app,这让它不只是语音回答,而是在试探家庭音频入口。

Kin Health 融资 900 万美元:AI 医疗记事转向患者端,难点不只是听清医生说了什么
Kin Health 完成 900 万美元种子轮融资,由 Maveron 领投,做的是面向患者的 AI 就诊记录工具,不是医生端病历系统。 它能录制问诊、转写、生成摘要和行动项,并分享给家人朋友,真正切中的是患者跨医院、跨专科管理病情的痛点。 但患者端 AI 医疗记事的门槛也更硬:隐私、录音同意、摘要准确性、口音识别和责任归属,都还没有被产品一句“AI 总结”解决。

AI竞争的暗线:模型发布会之外,谁在控制实验和训练
Import AI 457串起四个信号:Fast16污染高精度计算,Muon暴露优化器风险,positive alignment把安全问题推向价值治理,LLM开始自动优化训练流程。我的判断是,AI竞争的分水岭正在从单点模型能力,下沉到算力、优化器、安全审计和科研自动化这些底层控制权。

PaddleOCR 3.5 接入 Transformers:模型没换代,接入少绕路
PaddleOCR 3.5 新增 Transformers 推理后端,开发者可用 engine="transformers" 在 Hugging Face / PyTorch 工作流里运行受支持的 OCR 与文档解析模型。它的价值不在宣称精度或速度提升,而在降低接入摩擦。对做 RAG、Document AI、搜索和 Agent 的团队,这更像一次工程入口改造;若追求高吞吐,默认 paddle_static 仍是更稳的选择。

幼儿园摄像头训练 AI:真正越界的不是技术,是默认同意
华盛顿大学 Gail Joseph 与 Cultivate Learning 团队曾计划让幼儿园教师佩戴第一视角摄像头,并在教室架设固定摄像机,拍摄儿童课堂互动,用于训练评估课堂质量的 AI 模型。项目在家长反弹后被校方称已终止,但争议没有结束:低龄儿童课堂一旦变成数据采集现场,默认退出、云端处理和未来共享都不能靠含糊文字带过。对家长和教育从业者来说,接下来最该盯住的不是 AI 口号,而是同意机制、数据去向和退出成本。

Agent 评测开始算总账:Hugging Face 与 IBM 把成本和失败也放上榜
Hugging Face 与 IBM Research 发布 Open Agent Leaderboard,评测对象是完整 AI Agent 系统,而不是单独模型。它同时报告平均成功率、平均单任务成本和分基准结果,把“能不能做成事”和“做成要花多少钱”放在同一张表里。更关键的信号是:Agent 评测正在从比模型分数,转向比系统泛化、成本控制和失败行为。

AI 竞争到 2026:烧钱买算力容易,把算力变成利润很难
Benedict Evans 在《AI eats the world》里把 2026 年 AI 竞争概括为一场平台迁移:资本开支、算力部署、用户使用和产业重组同时挤在一起发生。最关键的变量可能不再是模型多强,而是谁能把天量算力、浅层用户使用和真正付费的软件场景对齐。对创业者和企业买家来说,接下来要看的不是演示效果,而是推理成本、留存、部署周期和 ROI 能不能闭环。

AI 写代码这么久,为什么还没有提示词版 Photoshop?
一篇独立开发者博客把 vibecoding 争议问到关键处:如果提示词已经抹平复杂软件门槛,为什么还没看到可验证的 Photoshop、Excel、Blender、数据库或 OS 级作品批量出现?作者的判断更克制:AI 主要压低写代码的体力成本,验证、架构和产品判断仍是硬门槛。把作品粗暴扣成“vibecoded”,很多时候不是技术批评,而是身份焦虑。

GenCAD 的看点不是生成 3D 外形,而是生成可编辑 CAD 历史
GenCAD 提出从图像生成参数化 CAD 命令序列,再转换为 3D 实体模型。它的价值不在于多做一个 3D 外形生成器,而在于尝试绕开 mesh、voxel、point cloud,直接生成可编辑的 CAD program。工程团队可以把它当作设计自动化方向的研究信号,但不宜据此延后采购或迁移现有 CAD 流程,关键还要看精度、鲁棒性和复杂 B-rep 适配。

Siri 要靠“自动删聊天”翻身?苹果这张隐私牌还不够
据 Bloomberg 记者 Mark Gurman 报道,苹果可能在 6 月 WWDC 发布新版 Siri,并把隐私作为核心卖点,包括聊天记录自动删除、独立 Siri 应用,以及部分能力可能由 Google Gemini 支撑。这个线索比单纯的“自动删记录”更关键:新版 Siri 不只是改一个隐私设置,而是苹果试图把 Siri 从系统命令入口改造成 AI 聊天入口。隐私能帮苹果重新建立信任,但如果能力补课不够,Siri 还是很难从 ChatGPT、Gemini、Claude 手里抢回用户习惯。