人工智能资讯 第43页
聚合当前分类下的最新内容,按时间顺序查看第 43 页精选文章。

IrisGo获AI Fund领投:桌面AI代理能不能从演示走进办公室
IrisGo获Andrew Ng的AI Fund领投,完成280万美元种子轮,并推出可观察、学习桌面操作的AI助手Iris,目前是macOS和Windows beta版本。它真正押注的不是咖啡下单演示,而是把邮件、发票、报告、文档总结、代码辅助这类重复办公流程自动化。我的判断是:方向成立,但企业采购和IT接入还应观望,关键要看隐私边界、异常处理和审计能力。

OpenAI又碰Erdős猜想:这次AI数学发现更可信,但别急着封神
OpenAI称一款通用推理模型反驳了Erdős在1946年提出的离散几何猜想,给出了优于传统方格网格思路的新构造。真正关键的增量不只是“AI解数学题”,而是这次有Noga Alon、Melanie Wood、Thomas Bloom等数学家提供支持性评述,可信度比七个月前那次GPT-5误报高得多。我的判断是:AI已经摸到真实科研问题的门槛,但门槛后面还有公开证明、同行复核和可重复产出的硬账要算。

30 tokens/s 有多快:把大模型速度指标翻译成等待感
Mike Veerman 做了一个 HTML 小工具,可以模拟 LLM 从每秒 5 到 800 token 的输出速度,Simon Willison 推荐了这个链接。 它不是模型基准测试,价值在于把厂商常写的 tokens/s,转成开发者和产品经理能看到的输出节奏。 tokens/s 适合比较流式输出体验,但不能替代首 token 延迟、网络延迟、上下文长度和模型质量判断。

特斯拉 FSD 在立陶宛获准使用,欧洲监管口子正在变大
特斯拉 FSD(Supervised)在立陶宛获准使用,这是继荷兰之后第二个放行该功能的欧洲国家。真正重要的不是立陶宛市场本身有多大,而是欧洲监管路径是否开始松动,这关系到特斯拉 FSD 订阅增长和马斯克“AI/机器人公司”叙事能否落到收入上。

AI 监管之争进了美国选举,OpenAI、Anthropic 阵营都在抢规则座位
Anthropic 与 OpenAI 相关阵营支持的 AI 超级 PAC,正在把监管路线之争推向美国中期选举。 核心变化不是公司互怼,而是产业资金开始影响候选人命运、国会席位和监管议程。 接下来要盯的,不是谁喊“安全”或“创新”更响,而是谁能把自己的监管语言写进政治叙事。

Gemini Spark 越好用越吓人:Google 的 AI 管家省下的时间,到底归谁?
Google 的 Gemini Spark 早期试用显示,它已经能替用户处理日程、邮件和表格任务,但 The Verge 的上手体验补上了更刺眼的一点:它能推断出用户没有明确告诉 Google 的私人信息。Spark 的问题不只是“AI 管家能不能跑腿”,而是当平台把你的工作、关系、习惯和生活痕迹串起来以后,效率红利和隐私风险都不再只由你决定。

Stability Audio 3.0 发布:6 分钟生成、端侧模型和版权牌,优势还要看许可边界
Stability AI 发布 Stability Audio 3.0,最高可生成 6 分 20 秒音乐,small SFX、small、medium 开放权重,large 只走 API 和付费自托管。它的看点不只是时长变长,而是把端侧部署、开放权重和授权数据叙事打包给开发者和企业客户。真正的限制也很清楚:large 不开放,企业许可有门槛,唱片公司合作不等于版权风险归零。

Intuit 裁掉 17% 员工:公司在赚钱,AI 成了改组织的理由
Intuit 将裁掉约 3000 名员工,占全球员工 17%,理由是减少复杂性、简化结构、把资源转向 AI 产品。反常点在于,它上一财季营收和净利润仍在增长。更准确的判断是:这不是财务恶化后的求生裁员,而是传统软件公司借 AI 叙事重排预算、组织和权力。

Google 把搜索也改成 AI Agent:网页还在,但出场顺序变了
Google 在 I/O 2026 上把话说得很直:Google Search is AI Search。相比单纯把 AI Agent 塞进全家桶,更关键的变化是搜索入口本身开始变成任务分发层,网页从目的地退到素材库。用户会更省事,内容网站会更被动,真正要看的不是模型多聪明,而是 Google 会把多少点击、服务和决策留在自己页面里。

Google把AI内容验证带进Chrome和搜索:标记系统开始面对普通用户
Google在I/O 2026宣布,SynthID验证能力将进入Chrome和Google Search,同一界面也会检查C2PA内容凭证。关键变化不是Google能识别所有AI内容,而是AI标记验证从专门工具走到大众入口。接下来真正要看的,是有多少内容带标记、标记能否被保留,以及普通用户会不会因此少一次误信和误转。

Figma 把 AI 放进画布:设计师不必慌,但虚忙会被清算
Figma 在 Figma Design 首发自有 AI 助手,可用自然语言生成设计、修改现有稿、批量做迭代,并支持多个 agent 并行工作。关键变化不是“多了一个 AI 按钮”,而是 Figma 正把协作画布改成一套人机共同生产系统。设计师不会立刻被替代,但执行细节会变便宜,团队负责人要重新分配人、工具和评审标准。

NanoClaw拒绝约2000万美元收购:1200万美元种子轮背后,押的是AI Agent安全部署
NanoCo完成1200万美元超额认购种子轮,Valley Capital Partners领投,Docker、Vercel、Monday.com、Slow Ventures等参投。 它拒绝约2000万美元收购邀约,不等于确认估值,更像是在押注开源社区和企业安全需求。 真正要看的不是NanoClaw能不能继续刷屏,而是它能否把开发者热度变成企业愿意付费的部署、审计和持续支持。

Qwen3.7-Max:通义押对了 Agent,生产力账单还没算完
阿里通义发布闭源模型 Qwen3.7-Max,将通过 Alibaba Cloud Model Studio API 提供,主打代码代理、办公自动化、长时自主执行和跨框架泛化。它最值得看的不是单项榜单,而是工具调用、长程执行和跨 harness 稳定性。方向押对了,但官方基准、闭源 API、价格和合规细节还没摊开,不能直接喊生产力革命。

Figure 机器人直播爆火:耐力秀很成功,通用劳动力还没到
Figure AI 把 Figure 03 分拣包裹的 8 小时演示延长成 24/7 直播,还用人机对战、机器人命名和周边商品把窄任务推成科技圈爆点。它证明了特定仓储动作的连续运行能力,也证明了 Figure 很懂传播。真正没被证明的,是成本、可靠性、泛化能力和无独立验证下的商业可部署性。

13 万行 Rust 之后,AI 编程的真门槛不是写代码
一位开发者用约 3 个月,借助多种 AI 编程代理重写了一个 Rust 版 multi-Paxos/RSL 类系统,代码超过 13 万行,测试超过 1300 个。单机笔记本吞吐从约 23K ops/sec 推到约 300K ops/sec,但这不是生产级分布式系统的证明。真正有价值的是方法:contracts、人类审阅、property-based tests 和性能实验,决定 AI 是杠杆,还是幻觉放大器。

OpenAI把教育AI推向国家级部署,新加坡入局后的关键不只是卖工具
OpenAI披露“Education for Countries”首批国家进展,并将新加坡纳入合作体系,教育AI正在从单点工具接入走向政府主导的规模化部署。真正重要的是,它把研究测量、本地化工具和教师培训放在同一套框架内;仍需警惕的是,早期使用数据不能等同于长期学习成效。

AI 争议同一天撞到四个入口:书、小说、搜索和办公软件
Kottke 汇总的几条 AI 新闻指向同一件事:争议已经从模型能力,转向事实来源、创作边界、搜索入口和软件选择权。非虚构书里的 AI 错引,和作家用 AI 找素材,不该混为一谈。对内容团队和科技产品从业者来说,接下来要盯的不是 AI 演示多漂亮,而是谁负责核查、标注、关闭和纠错。

OpenAI押注新加坡:模型公司开始做国家级AI基建生意
OpenAI在新加坡ATx峰会上宣布与MDDI启动多年合作,承诺超过3亿新元,建设其美国以外首个Applied AI Lab,并在未来数年创造200多个本地技术岗位。重点不在“开办公室”,而在把模型、部署工程、政府场景和本地人才打包,服务新加坡国家AI战略。对政府、大企业、开发者和中小企业来说,这会加速AI采用,也会抬高依赖、人才和治理成本。

datasette-agent-micropython 0.1a0:AI 查数要进账房,先把代码关进笼子
Simon Willison 发布 datasette-agent-micropython 0.1a0,把 MicroPython 放进 WASM sandbox,试图让 Datasette Agent 安全生成并执行 Python 代码。相比只讨论 AI 能不能查数,这个版本补上了更关键的一环:Agent 一旦开始跑代码,权限、隔离和审计才是真门槛。

GitHub 去 AI 水印项目提醒:AI 溯源不能只靠文件标签
GitHub 上的 remove-ai-watermarks 项目宣称可处理 Gemini、DALL-E、Stable Diffusion、Firefly、Midjourney 等 AI 图像的可见水印、隐形水印和来源元数据。它未必证明 AI 水印体系已经失效,但至少说明:把平台标识和合规判断押在本地文件标签上,风险很高。对平台安全和合规团队来说,下一步不是相信或封杀某个工具,而是减少对单一元数据字段的依赖。

Google 说要“解决所有疾病”:AI 医疗的大词,不能替代临床证据
Google DeepMind 在 I/O 2026 上把 Gemini for Science 推到药物发现叙事中心,Demis Hassabis 甚至说目标是有一天“解决所有疾病”。真正新增的判断不是 Google 又说了一个大词,而是这套叙事必须被放回药物研发链条里看:AI 能加速早期发现,不能跳过临床、监管、伦理和支付。