人工智能资讯 第5页

聚合当前分类下的最新内容,按时间顺序查看第 5 页精选文章。

AI 编程代理进团队,别把审查权也交出去
人工智能 2026/6/30

AI 编程代理进团队,别把审查权也交出去

Simon Willison 引述 Jon Udell 的核心提醒:别把 AI 编程代理说成流程主角,人类只是 loop 里的兜底人。真正要盯住的不是代理会不会写代码,而是 PR 是否可审查、变更是否可拆、责任是否还在团队手里。

AI 编程代理代码审查开发流程
智谱 GLM-5.2 逼近 Mythos:真正麻烦的不是追平,而是扩散
人工智能 2026/6/29

智谱 GLM-5.2 逼近 Mythos:真正麻烦的不是追平,而是扩散

智谱 Z.ai 发布开源权重模型 GLM-5.2,有研究者称它在部分漏洞发现和网络安全场景中接近 Anthropic Mythos,但通用能力仍落后于 Anthropic、OpenAI 顶级模型。真正值得盯的不是“中国模型全面赶超”,而是网络攻防能力正在从少数封闭模型扩散到更容易下载、部署和改造的开源权重模型里。

GLM-5.2智谱 Z.ai开源权重模型
Suno 的 Spark 计划:扶持独立音乐人,也在重写平台权利
人工智能 2026/6/30

Suno 的 Spark 计划:扶持独立音乐人,也在重写平台权利

Suno 推出 Spark 孵化计划,面向未签约 singer、songwriter、producer 提供资助、指导和营销支持。争议不在补贴本身,而在申请条款:remix、衍生作品授权、有限独占、放弃审判和集体诉讼权,以及不得负面描述 Suno 的“Good Vibes Only”。这更像 AI 音乐平台从工具走向分发和造星时,对创作者权利的一次重新定价。

SunoAI音乐Spark孵化计划
GLM 5.2在IDOR基准超过Claude Code,但安全AI的胜负不只看模型
人工智能 2026/6/30

GLM 5.2在IDOR基准超过Claude Code,但安全AI的胜负不只看模型

Semgrep在同一IDOR数据集、同一评估方法、同一提示词下测试发现,GLM 5.2以39% F1超过Claude Code约32%上下,但仍落后于Semgrep自家带专用harness的管线。\n这次结果更像一个信号:安全AI的竞争,正在从单个模型能力,转向模型、脚手架、成本和部署控制权的组合竞争。\n对AppSec和安全工程团队来说,真正该买的不是某个模型神话,而是一套可替换、可验证、可落地的检测系统。

安全AIGLM 5.2Semgrep
企业 AI 的 token 狂热降温:烧钱指标退场,长循环智能体重新算账
人工智能 2026/6/30

企业 AI 的 token 狂热降温:烧钱指标退场,长循环智能体重新算账

企业早期用 token 用量硬推 AI 采用,甚至出现让两个 agent 空转刷量的荒诞做法;现在额度收紧、API 成本上升,“无限 token”政策开始回撤。真正的变化不是 tokenmaxxing 死了,而是它从组织激励,转向用更多计算换更可靠结果的成本收益题。开发者工具值得继续投,脆弱的 agent 流水线要重新算账。

企业 AItoken 用量AI 智能体
福特请回350名“灰胡子”工程师:AI还在用,但经验重新上桌
人工智能 2026/6/30

福特请回350名“灰胡子”工程师:AI还在用,但经验重新上桌

福特在AI和自动化质量系统效果不及预期后,重新聘用350名资深工程师和技术专家,部分是前员工,部分来自供应商。 这不是福特放弃AI,而是承认汽车质量不能只靠模型、流程和设计要求。 对制造业和AI团队来说,真正要补的不是一个新工具,而是专家校准、供应链经验和新人训练。

福特人工智能自动化质量系统
AI 编程把工程师推向审稿台:效率之外,软件行业在失去什么
人工智能 2026/6/30

AI 编程把工程师推向审稿台:效率之外,软件行业在失去什么

一名兼写小说的软件工程师在《Reflections on Software Engineering in the Age of AI》中反思:AI 编程正在把开发者从亲自设计、实现和调试的人,推向提示词作者和代码审稿人。AI 不是无用,它能查概览、写样板、生成可用代码;真正的问题是,提效是否正在用心流、训练机会和系统理解力来付款。对工程师和技术管理者来说,关键不只是用不用 AI,而是哪些活必须保留给人亲手做。

AI 编程软件工程师代码审查
开放模型不再只追 GPT:真正的战场是入口和供应链
人工智能 2026/6/30

开放模型不再只追 GPT:真正的战场是入口和供应链

开放权重模型正在从少数头部玩家的前沿竞赛,变成纯模型公司、大科技、产品公司和主权 AI 玩家共同下场的长尾格局。关键变化不只是模型更多,而是许可证、算力、渠道和产品供应链开始重新分配控制权。开发者和企业现在最该看的,不是榜单热闹,而是能不能商用、能不能替换、成本能不能扛住。

开放模型开放权重模型NVIDIA
Claude 看 MRI 没判撕裂,真正松动的是医疗二次意见
人工智能 2026/6/29

Claude 看 MRI 没判撕裂,真正松动的是医疗二次意见

一名右肩痛患者把约 266MB、数百个 MRI DICOM 文件交给 Claude Code / Opus 4.8 分析,AI 给出的“无明确撕裂”与诊所报告的“肩胛下肌腱 III 级部分撕裂”明显冲突。这个案例不能证明医生误诊,也不能证明 AI 能替代医生;它真正刺到的是医疗里的信息不对称、治疗激励和二次意见成本。

AI 医学影像分析MRIClaude Code
ChatGPT 记录进了纵火案,但陪审团没把它当铁证
人工智能 2026/6/28

ChatGPT 记录进了纵火案,但陪审团没把它当铁证

洛杉矶帕利塞兹山火纵火案中,检方把被告 Jonathan Rinderknecht 的 ChatGPT 对话记录列为证据之一,但陪审团以 10 比 2 倾向辩方,案件流审。真正的新问题不是 AI 会不会诱发犯罪,而是私人 AI 对话能不能被检方包装成动机证据。对 AI 隐私、数字证据和平台治理读者来说,这案子给出的信号很直接:以后聊天记录会更常进法庭,但证明力会被更严厉地追问。

ChatGPTAI聊天记录司法证据
印度 UPI 冲击 10 亿日交易:AI 会上桌,但真正难的是分钱
人工智能 2026/6/28

印度 UPI 冲击 10 亿日交易:AI 会上桌,但真正难的是分钱

印度 UPI 日交易量已超过 7.5 亿笔,NPCI 负责人 Dilip Asbe 认为,冲击 10 亿笔会越来越依赖 AI。AI 的重点不是炫技,而是拉新、反欺诈、信用覆盖、语音和多语言体验。真正卡住 UPI 下一阶段的,仍是监管责任、商业模式和 PhonePe、Google Pay 占比过高的市场结构。

UPIAI 支付NPCI
Wayfinder Router 开源:别把小问题都送去云端大模型
人工智能 2026/6/28

Wayfinder Router 开源:别把小问题都送去云端大模型

Wayfinder Router 是一个开源 CLI 和 OpenAI-compatible 网关,用离线、确定性的复杂度评分,把请求分给本地模型或云端模型。它的价值不在“更懂语义”,而在可解释、低成本、可自托管,且不为路由决策额外调用模型。它适合控成本和降延迟,但短而难、纯语义难度的问题,仍可能被误判。

Wayfinder Router大模型路由本地模型
Strix Halo 双机跑 vLLM 有了 RDMA 路径,但别急着当消费级 AI 集群买
人工智能 2026/6/28

Strix Halo 双机跑 vLLM 有了 RDMA 路径,但别急着当消费级 AI 集群买

一个 GitHub 个人项目给出 Strix Halo 双节点通过 Intel E810 RoCE v2 跑分布式 vLLM 推理的配置路径。它的价值是把硬件、Fedora 43、RDMA 和 RCCL 补丁串成了可复现工程记录。限制也很硬:目前只适合熟悉 Linux、ROCm、RDMA 的玩家和开发者,不适合当作稳定交付方案。

vLLMStrix Halo分布式推理
Instagram 让你调算法,但不让你拿回分发权
人工智能 2026/6/28

Instagram 让你调算法,但不让你拿回分发权

Instagram 正在测试把 Your Algorithm 放到信息流和 Reels 更近的位置,用户可能直接选择想多看、少看哪些内容。它改善的是反馈入口,不是完整算法控制权。最该观察的不是按钮有几个,而是 Instagram 会不会给“只看关注的人”一个稳定、清晰的选择。

Instagram推荐算法Your Algorithm
孙正义质疑马斯克太空数据中心:AI算力缺口等不了十年
人工智能 2026/6/28

孙正义质疑马斯克太空数据中心:AI算力缺口等不了十年

孙正义质疑的不是太空基础设施本身,而是把轨道数据中心当成未来几年AI算力短缺的解药。TechCrunch播客把这件事放到OpenAI自研芯片、Groq融资和SpaceX算力租赁的同一张桌上看,争议就变成了:这是新基础设施,还是更利于SpaceX发射和算力生意的叙事。对AI团队和采购方来说,短期预算仍应押在可交付的GPU、云服务、电力合同和芯片适配上。

AI算力短缺太空数据中心孙正义
阿特伍德批评 AI:真正危险的是错得很流畅
人工智能 2026/6/28

阿特伍德批评 AI:真正危险的是错得很流畅

阿特伍德在葡萄牙波尔图 Babell 文学与文化节谈到,她只用过一次 Claude,查询英剧《布朗神父》信息时就拿到错误答案。她的批评不是反科技,而是提醒用户:大模型不是事实机器,流畅回答仍要人工核验。对内容创作者和知识工作者来说,AI 可以省起草时间,但不能省掉查证成本。

生成式AI大语言模型Claude
35岁创业者患罕见淋巴瘤:Claude没有治癌,但帮他问对了问题
人工智能 2026/6/27

35岁创业者患罕见淋巴瘤:Claude没有治癌,但帮他问对了问题

35岁创业者Connor Christou在多年体检正常后,被查出胸骨后方约11×11×8厘米的罕见侵袭性非霍奇金淋巴瘤。治疗中,他把血检、影像、可穿戴设备数据和语音症状日志输入Claude,用来整理材料、生成问题、准备多方专家意见。这个案例的价值不在于AI诊断癌症,而在于通用AI已经能帮患者补一部分信息差,但关键判断仍必须由医生复核。

Claude医疗AI癌症诊疗
Anthropic 出口限制后,Sakana 和 360 开始填补亚洲 AI 安全空档
人工智能 2026/6/27

Anthropic 出口限制后,Sakana 和 360 开始填补亚洲 AI 安全空档

美国约两周前限制 Anthropic 向非美国用户提供 Mythos 与 Fable 5,日本 Sakana AI 和中国 360 随后推出面向编排、安全防御的替代产品。 目前没有公开证据能证明这些产品已追平 Mythos,但它们抓住了同一个采购痛点:先进能力之外,能不能稳定使用正在变成硬指标。 受影响最大的不是普通用户,而是把 AI 接入漏洞发现、事件响应和代理流程的企业与政府客户。

Anthropic出口管制Mythos
DeepSeek 开源推理优化:比模型跑分更硬的是 token 成本
人工智能 2026/6/27

DeepSeek 开源推理优化:比模型跑分更硬的是 token 成本

DeepSeek 在 GitHub 仓库 deepseek-ai/DeepSpec 公开 DSpark_paper.pdf,论文/项目宣称生成速度提升 60%–85%。这个数字还不是第三方验证结果,但方向很关键:大模型竞争正在从训练炫技,压到推理吞吐、延迟和部署成本。真正要看的是复现难度、适配范围,以及线上账单能不能真的降下来。

DeepSeek大模型推理生成速度
Claude Mythos 5 只对白名单放行:前沿模型发布权正在移交
人工智能 2026/6/27

Claude Mythos 5 只对白名单放行:前沿模型发布权正在移交

6 月 26 日,美国商务部致信 Anthropic,允许 Claude Mythos 5 向 Annex A 名单内的 100 多家可信美国机构、企业和政府部门开放。它不是全面公开发布,Fable 5 也尚未正式放行。更重要的是,前沿模型发布正在从公司产品节奏,变成政府安全审查、白名单准入和地缘政治工具的一部分。

Claude Mythos 5Anthropic前沿AI模型
AI 做出可发表级数学结果后,真正被改写的是数学家的训练方式
人工智能 2026/6/27

AI 做出可发表级数学结果后,真正被改写的是数学家的训练方式

AI 数学系统已经从解奥赛题,推进到发现反例、产出可发表级研究和形式化验证前沿证明。它还没有全面取代数学家,但已经碰到纯数学研究的核心流程。真正的争议是:数学的价值到底落在答案上,还是落在人类能理解、能交流、能继续协作的证明过程上。

AI数学研究Google DeepMindOpenAI