人工智能资讯 第48页

聚合当前分类下的最新内容,按时间顺序查看第 48 页精选文章。

“11 个 AI agents”,听起来很强,其实什么也没说
人工智能 2026/5/14

“11 个 AI agents”,听起来很强,其实什么也没说

Simon Willison 摘引了 Boris Mann 的一句话:说自己有“11 个 AI agents”,和说自己有 11 个表格、11 个浏览器标签差不多,都不能说明真实能力。真正该追问的不是 agent 数量,而是它们能独立完成什么、能承担什么责任、能减少多少人工协调。

AI agents智能体Simon Willison
Claude 进小企业:AI 不再陪聊,开始摸账本了
人工智能 2026/5/14

Claude 进小企业:AI 不再陪聊,开始摸账本了

Anthropic 推出 Claude for Small Business,把 Claude 接进 QuickBooks、PayPal、HubSpot、Canva、Docusign、Google Workspace、Microsoft 365 等工具,瞄准小企业的财务、销售、营销、合同和客服杂活。更关键的细节是,它不是单纯卖一个聊天机器人,而是用 15 个现成工作流把 AI 放进经营现场;这强化了一个判断:AI 平台战开始贴地飞行,入口不在模型榜单,而在小老板每天处理的账本、发票和客户跟进里。

Claude for Small BusinessAnthropic小企业
Meta AI 的无痕聊天更进一步:不留日志还加密,用户的真心话成了平台硬成本
人工智能 2026/5/14

Meta AI 的无痕聊天更进一步:不留日志还加密,用户的真心话成了平台硬成本

扎克伯格宣布 Meta AI 将推出 Incognito Chat,号称服务器不保存对话日志,并采用端到端加密,未来数月进入 WhatsApp 和 Meta AI app。和普通 AI 聊天的“临时模式”相比,Meta 这次把牌打到了更硬的一层:不是不进历史记录,而是声称连 Meta 也读不到。问题也因此更尖锐:AI 必须处理你的输入,平台又说自己看不见,真正要看的不是口号,是技术边界和审计。

Meta AIIncognito Chat端到端加密
Anthropic 在 Ramp 样本中反超 OpenAI:企业买 AI,开始不只认名气
人工智能 2026/5/13

Anthropic 在 Ramp 样本中反超 OpenAI:企业买 AI,开始不只认名气

Ramp 最新 AI Index 显示,在 5 万多家客户样本中,34.4% 企业付费使用 Anthropic,首次超过 OpenAI 的 32.3%。 这不是全球企业 AI 市场份额排名,只能说明 Ramp 样本里的客户渗透率变化。 真正该看的不是谁登顶,而是企业 AI 采购正在从品牌心智,转向执行、场景和技术团队口碑。

AnthropicOpenAI企业AI采购
AI 代码占比冲高后,工程师开始替它付审查账
人工智能 2026/5/13

AI 代码占比冲高后,工程师开始替它付审查账

Google 称新代码 75% 由 AI 生成,微软、Anthropic 也在宣传更高的 AI 编程占比;但匿名开发者反馈显示,采用压力、审查负担和技术债正在上升。问题不在 AI 会不会写代码,而在管理层把使用率当成绩效和叙事指标。对开发者和技术管理者来说,下一步该看代码质量、审查成本和新人能力建设,而不是只看生成比例。

AI生成代码AI编程技术债
Alexa 接管亚马逊搜索框:购物 AI 从导购走到代购
人工智能 2026/5/14

Alexa 接管亚马逊搜索框:购物 AI 从导购走到代购

Amazon 推出由 Alexa+ 驱动的 Alexa for Shopping,面向美国用户开放,并取代 2024 年上线的 Rufus。关键变化不只是搜索栏多了聊天入口,而是 AI 开始连接推荐、比价、价格追踪、周期补货和部分站外购买;便利是真的,平台控制力也更重了。

Alexa for ShoppingAmazon购物AI
AutoScientist 发布:别急着喊模型自我进化,它盯上的是训练门槛
人工智能 2026/5/13

AutoScientist 发布:别急着喊模型自我进化,它盯上的是训练门槛

Adaption 发布 AutoScientist,基于既有 Adaptive Data,把数据集优化和模型微调接成一个自动化闭环。它不等于模型自主科研,也不是递归自我进化,更像是在把垂直能力微调从少数高手手里拆出来。真正要看的,是企业和中小 AI 团队能不能用它稳定复现效果,而不是被“win-rate 翻倍”一句话带跑。

AutoScientistAdaption模型微调
Substrate 招 TSM:医疗 AI Agent 落地,缺的不是演示,是排雷的人
人工智能 2026/5/13

Substrate 招 TSM:医疗 AI Agent 落地,缺的不是演示,是排雷的人

Substrate 这条招聘的反常点很明确:岗位叫 Technical Success Manager,实际要求会 SQL、读代码、查生产数据库、懂 LLM/evals,还要承担留存或扩张责任。它暴露的不是一个普通客户成功岗位,而是医疗 AI Agent 进入真实 RCM 流程后,前线岗位正在变成半工程、半实施、半销售。对 AI Agent 和 B2B SaaS 团队来说,接下来要看的不是 demo 多顺,而是生产排障、责任归属和客户续用能力。

医疗AISubstrateAI agents
亚马逊被问到 AI 手机,Panos Panay 没否认,但重点不是 Fire Phone 复活
人工智能 2026/5/13

亚马逊被问到 AI 手机,Panos Panay 没否认,但重点不是 Fire Phone 复活

Panos Panay 在 Financial Times 采访中没有明确否认亚马逊重做手机,只说目标“不一定是手机”,直接回答 no 虽然准确但会误导。此前传闻称亚马逊在做代号 Transformer 的 Alexa AI 设备,探索过智能手机和 dumbphone 形态,但目前没有发布确认。真正要看的不是 Fire Phone 是否复活,而是亚马逊能不能借 AI 助手重新抢回随身入口。

亚马逊AlexaAI助手
OpenAI 部分微调 API 退场:微调没死,但不再适合多数团队当默认答案
人工智能 2026/5/13

OpenAI 部分微调 API 退场:微调没死,但不再适合多数团队当默认答案

OpenAI 正在弃用部分 finetuning API,这不是全面取消微调能力,但足够说明微调路线在主流 AI 应用工程里降温。 多数团队该先补长上下文、RAG、工具调用、agent 流程和推理成本账本;顶级应用和开源模型团队,反而还会继续押注后训练。 真正的分水岭不在“会不会微调”,而在数据、评测、部署和成本控制是否跟得上。

OpenAI微调finetuning API
AI 圈没大发布,但主战场已经换到工程账本
人工智能 2026/5/13

AI 圈没大发布,但主战场已经换到工程账本

这期 AI News 表面安静,硬信号却很密:评测继续加难,训练和推理继续降本,Agent 开始补运行时。我的判断是,AI 竞争正在从“谁的模型更大”转向“谁能把评测、成本、运行时和工作流做成系统”。对产品和工程团队来说,下一步不是追每个新榜单,而是重算模型选型、工具链权限和交付成本。

AI 评测Agent训练成本
AI 医疗真正的入口,不在模型,在 Medicare 的账单里
人工智能 2026/5/13

AI 医疗真正的入口,不在模型,在 Medicare 的账单里

美国 CMS 将在 7 月 5 日启动 10 年期 ACCESS 试点,让 150 家机构测试按慢病管理结果付费的新 Medicare 模型。它不是专门为 AI 公司开绿灯,但第一次给诊间之外的 AI 护理、随访和社会支持协调留下了可报销入口。

AI医疗MedicareCMS
媒体封堵 Wayback Machine:防 AI 抓取,别把新闻档案也一起关掉
人工智能 2026/5/13

媒体封堵 Wayback Machine:防 AI 抓取,别把新闻档案也一起关掉

数字权益组织 Fight for the Future 发起请愿,要求《纽约时报》、The Atlantic、USA Today 等主要媒体领导层停止阻止 Internet Archive 的 Wayback Machine 存档新闻内容。真正的争议不在于媒体能不能防 AI 抓取,而在于用同一把锁拦住公共存档,可能削弱新闻长期可访问性、事实核查和抗审查能力。

Wayback MachineInternet ArchiveAI抓取
“Ralph Loop”是假的,AI裁员焦虑是真的
人工智能 2026/5/13

“Ralph Loop”是假的,AI裁员焦虑是真的

Simon Willison 转引的是 Mo Bitar 在 TikTok 上的黑色幽默,不是 AI 方法论,也不是职场建议。虚构的“Ralph Loop”讽刺的是一种真实激励:谁能把“自动化”讲成预算、晋升和裁员理由,谁就可能先占到位置。真正该警惕的不是某个梗,而是企业用模糊 AI KPI 奖励话术投机。

AI裁员焦虑人工智能热潮职场激励
AI 数据中心搬到住宅旁:SPAN 的微型算力实验,省下机房后风险落到谁身上
人工智能 2026/5/13

AI 数据中心搬到住宅旁:SPAN 的微型算力实验,省下机房后风险落到谁身上

SPAN 想把搭载 GPU 的 XFRA 微型数据中心放到新建住宅旁,先在 2026 年做 100 户试点,2027 年扩到 8 万个节点、超过 1GW 分布式算力。它瞄准的是 AI 推理、云游戏和流媒体等边缘任务,不是替代大型训练数据中心。真正要看的不是宣传里的低成本,而是电网、合同、安全和居民体验能不能扛住。

SPANXFRA 微型数据中心分布式算力
AutoScout24 用 Codex 提效:数字很亮,关键不在买工具
人工智能 2026/5/13

AutoScout24 用 Codex 提效:数字很亮,关键不在买工具

AutoScout24 Group 已把 ChatGPT 推给约 2000 名员工,并让 Codex 进入约 1000 名工程、数据和产品人员的日常流程。官方称部分项目周期从 2-3 周缩短到 2-3 天,但这是 select projects,不能外推成全公司十倍提效。真正值得看的是流程:AI 编程工具只有进入 PR review、重构、文档和事故复盘,才可能从演示效率变成组织产能。

AutoScout24 GroupCodexChatGPT
NVIDIA用Codex:真正变贵的,是不会治理AI代理的团队
人工智能 2026/5/13

NVIDIA用Codex:真正变贵的,是不会治理AI代理的团队

OpenAI发布NVIDIA案例:部分工程与研究团队正在用基于GPT-5.5的Codex做生产系统、内部工具、代码迁移和端到端机器学习实验。材料里的10倍实验提速、最高约20倍效率提升,都来自受访者说法,不是独立评测。真正该看的不是AI写代码快了多少,而是工程组织的试错成本、权限边界和研发节奏正在被重新定价。

CodexNVIDIAOpenAI
Codex 走出代码区:办公室里先被压缩的,还是那层“材料拼装工”
人工智能 2026/6/3

Codex 走出代码区:办公室里先被压缩的,还是那层“材料拼装工”

OpenAI 把 Codex 推向数据分析、销售、设计、投资和投行等非开发岗位,新增角色插件、Sites 预览和 annotations。关键变化不在“AI 会写更多东西”,而在它开始接入企业已有工具和流程,压缩办公室里最常见的材料拼装层。真正的门槛也不在演示效果,而在权限、审计、数据隔离和员工是否愿意把关键流程交给它。

CodexOpenAI企业工作流
Threads 的 Meta AI 不能屏蔽:真正刺眼的是退出按钮被降级
人工智能 2026/5/13

Threads 的 Meta AI 不能屏蔽:真正刺眼的是退出按钮被降级

Meta 正在 Threads 测试一个可被 @ 调用的 Meta AI 账号,测试地区包括阿根廷、马来西亚、墨西哥、沙特和新加坡。争议点不在于它像不像 X 上的 Grok,而在于用户发现它不能像普通账号一样被彻底屏蔽。Meta 给出的静音、隐藏和“不感兴趣”,只能减少出现频率,不能替代 block。

Meta AIThreads用户控制权
Cactus 开源 2600 万参数 Needle:端侧 AI 的看点不是聊天,是工具调用变小
人工智能 2026/5/13

Cactus 开源 2600 万参数 Needle:端侧 AI 的看点不是聊天,是工具调用变小

Cactus Compute 开源 Needle,一个 2600 万参数的单轮函数调用模型,官方称由 Gemini 3.1 蒸馏而来,面向手机、手表、眼镜等小设备。它的价值不在于替代 Qwen、Gemma 这类通用模型,而在于把“选工具、填参数”这一步压到很小。对端侧 AI 团队来说,它更像一个可试的轻量路由器,但真实可用性还要看 schema 适配、微调成本和真机推理表现。

Needle端侧 AI函数调用模型
当“看起来懂”比真懂更值钱:AI 正在放大职场里的空洞表达
人工智能 2026/5/13

当“看起来懂”比真懂更值钱:AI 正在放大职场里的空洞表达

一篇观点文章批评职业平台正在奖励“看起来懂”的表演型输出:更容易被看见的,常常不是更准确的专业判断,而是更会制造互动的内容。生成式 AI 没有发明这种问题,但它把低成本、像样、可批量复制的空洞表达工业化了。真正受挤压的,是靠作品、验证和责任建立声誉的工程师、写作者、设计师与创作者。

生成式 AI职场内容空洞表达