人工智能资讯 第47页
聚合当前分类下的最新内容,按时间顺序查看第 47 页精选文章。

PCOS 改名 PMOS:一个新名字,照出健康 AI 的老问题
全球医学界推动将 PCOS 更名为 PMOS,核心不是发现了新病,而是纠正长期把它窄化为“卵巢囊肿”的认知。它影响约 1.7 亿女性,症状差异极大,也让可穿戴设备和健康 AI 的“个性化建议”承诺遇到现实边界:数据多,不等于理解慢性病。

梅奥急诊室用 AI 记录对话,真正麻烦在“默认录音”
梅奥诊所正在急诊等场景使用“环境监听”,默认录制患者与护士互动,再由 AI 辅助生成电子健康记录文档,患者可以选择退出。争议点不该只放在 AI 能不能减轻文书负担,而是急诊患者是否真的知道自己被录音,以及 AI 病历记录在噪音、口音、口罩等场景下是否可靠。对医疗 AI 从业者和医院数字化团队来说,这件事更像一次提醒:上线 AI 书记员,不能只算节省时间,也要把告知、退出、复核和留痕做成流程。

Osaurus 把本地 AI 做成 Mac 控制层:模型之外,入口开始值钱
Osaurus 是一款 Apple-only、开源的 Mac AI 控制层应用,能在本地模型和 OpenAI、Anthropic、Gemini、Grok 等云端模型之间切换,并把记忆、文件和工具尽量留在本机。 它还不能证明本地 AI 会替代云端 AI,64GB/128GB RAM 的门槛已经把大多数普通用户挡在门外。 真正值得看的是入口之争:当模型越来越像商品,谁控制用户电脑上的上下文、工具和执行权限,谁就更接近下一层价值。

whichllm 发布:本地 LLM 的麻烦,已经从装模型变成信推荐
whichllm 会自动识别 GPU、CPU 和内存,从 HuggingFace 模型中筛出能跑、跑得动、基准表现更好的本地 LLM。 它真正有价值的地方,不是少输几条命令,而是把模型、量化、榜单、显存和速度估算放到同一张账本里。 但它不是“客观真理机”。推荐结果仍取决于 HuggingFace 数据、榜单质量、权重设定和硬件估算。

GlycemicGPT 开源:AI 能帮忙管糖,但别把它当医生
GlycemicGPT/GlycemicGPT 已在 GitHub 开源推进,标语是“Because no one should manage diabetes alone”,定位是用 AI 辅助糖尿病日常管理。 它目前更像个人健康记录和辅助建议的早期实验,不是诊断、处方或调整治疗方案的医疗工具。 患者和照护者可以关注它能否减轻记录负担;开发者更该盯住隐私、安全边界、验证机制,而不是只看 star 数。

RelaxAI 走 OpenAI 兼容路线:低迁移成本是真的,低价和主权还要证据
RelaxAI 文档显示,它提供兼容 OpenAI API 的大模型推理服务,并配套 Python、TypeScript、Go 官方 SDK。对开发者最直接的价值,是少改代码接入另一个推理供应商。至于“UK sovereign”和“便宜 80%”,目前仅凭文档首页不能确认,还要看价格页、部署说明和模型能力数据。

范畴论进了 Rust 代码:这份 Tiny ML 草稿别急着吹,也别急着笑
《Category Theory for Tiny ML in Rust》上线的是开放访问工作草稿,不是成熟 ML 框架,也不是性能突破。它把 tiny ML 管线、Rust 类型系统和范畴论的对象、态射、组合放到同一套可运行示例里。真正值得看的是:抽象数学有没有机会变成 AI 工程里的类型边界、组合纪律和审计线索。

Sea 把 Codex 推进研发组织,AI 编程的考题换了
Sea 正在把 OpenAI Codex 推向开发者组织,覆盖代码理解、调试、功能开发和 CI/CD 等环节。OpenAI 披露的 87% 周活来自内部数据,73% 推荐率来自给 Codex 打 4 或 5 分的开发者反馈,不能当成第三方评测。真正该看的是:AI 编码代理能不能进入工程流程,而不是只在 demo 里写出漂亮代码。

AI 编程代理让技术栈迁移变轻:React Native 个案背后的新变量
Simon Willison 记录了一家公司用 coding agents 将两款老牌 iOS、Android 原生应用重写为 React Native,理由是 React Native 近年改进已覆盖其需求,若判断错误也能再迁回原生。这个案例的重要性不在于 React Native 赢了,而在于 AI 编程代理正在降低迁移和回滚成本,让技术栈选择更像可修正的工程判断。

Codex 进 ChatGPT 后,真正的战场不是手机,而是长期工作流
Codex 接入 ChatGPT 手机端,表面看是 OpenAI 把编程助手塞进更大的入口;Jason Liu 的长期使用实践则把另一层意思挑明了:Codex 正在从聊天式代码工具,靠近一个能记事、等反馈、跑流程的个人工作系统。真正的分水岭不在模型会不会写更多代码,而在它能不能接住 Slack、邮件、浏览器、文档、测试和人工审批这些脏活。

DS4 火了:本地 AI 终于摸到生产力门槛
Redis 作者 antirez 的 DwarfStar 4 因 DeepSeek v4 Flash 和 2/8 bit 非对称量化走红,高端本地机器第一次有机会跑出接近严肃可用的 AI 体验。它还不能全面替代 Claude 或 GPT,但已经把本地 AI 从“能跑”推到“部分任务值得用”。真正的门槛不在热度,而在模型、量化、硬件和持续工程能力。

PoopCheck 被曝有人兜售 15 万张粪便图:健康 AI 的数据边界在哪
404 Media 报道称,PoopCheck 相关人员曾在 Reddit 数据交易社区试图出售约 15 万张已标注粪便图片的访问权,数据来源涉及约 2.5 万名用户。目前只能确认有人兜售访问权,不能确认已经成交。更重要的问题是:消费级健康 AI 正在把极私密的身体数据做成可标注、可训练、可报价的资产。

IBM 的 Granite Embedding R2:小模型不抢戏,但很会卡位
IBM 在 Hugging Face 发布 Granite Embedding Multilingual R2:97M 和 311M 两款 Apache 2.0 多语言 embedding 模型,面向 RAG、企业搜索和多语言知识库。97M 主打 sub-100M 检索性价比,311M 主打 32K 长上下文和更高质量。真正要看的不是跑分第一,而是 IBM 把许可、部署、长文档、多语言这些企业落地变量放进了同一个选择里。

Android 开始猜你下一步:Google 的 AI 情境建议,边界在默认开启
Google 正在向部分运行 Android 16 的 Pixel 10 系列设备推送 contextual suggestions,可按位置和习惯预测下一步操作,Google 尚未正式宣布。 这项功能曾出现在 Play Services beta,如今疑似进入稳定渠道,并且看起来默认开启。 真正值得盯的不是它有多聪明,而是系统级 AI 什么时候该出现、能访问什么、用户能不能干净地关掉。

AI 答案谁说了算?Forum AI 想把模型口径放上秤
Campbell Brown 创办的 Forum AI,正在用专家基准和 AI judge 评估大模型在地缘政治、心理健康、金融、招聘等高风险议题上的回答质量。真正值得盯的不是某个模型答错一次,而是 AI 变成信息入口后,谁来定义准确、平衡和可信。对普通用户和企业 AI 采购者来说,下一步要看的不是模型多会说,而是回答规则能不能审计、偏差能不能解释、出事后责任能不能落地。

Clio ARR 达 5 亿美元:法律科技会成为 LLM 下一个高价战场吗
加拿大法律科技公司 Clio 宣布 ARR 达到 5 亿美元,AI 集成后增长明显提速。真正重要的不是一个数字本身,而是法律文本工作流正在成为继代码生成后,LLM 最容易卖出高客单价的企业场景之一。Anthropic 推出 Claude for Legal 新功能后,依赖基础模型的法律 AI 初创公司将面对更复杂的供应商竞争关系。

AI Model ELO History:别只看模型登顶,也要看它后来有没有缩水
AI Model ELO History 基于 Hugging Face 上的 LM Arena Leaderboard Dataset,每日抓取排行榜数据,追踪各大 AI 实验室旗舰模型的最高 ELO 曲线。它的重点不是今天谁第一,而是模型发布后能力、约束和调度是否发生变化。对开发者和产品团队来说,这类长期曲线比发布会分数更接近采购和接入决策。

Edge 让 Copilot 读取多个标签页,AI 浏览器开始考验授权边界
微软正在给 Edge 加入一组 Copilot 功能:在用户开启后,它可读取多个已打开标签页、当前页面,并在授权后访问浏览历史,用来问答、比较商品、总结文章和辅助学习。 这说明 Edge 正从传统浏览器变成带上下文和记忆能力的 AI 浏览入口。 真正要看的不是功能有多炫,而是用户能不能清楚控制:它看了什么、为什么看、看完后怎么用。

Notion 开放 AI Agent 和外部数据接入:协作文档开始抢自动化入口
Notion 发布新的 Developer Platform,Business 和 Enterprise 用户可以把自定义 AI Agent、外部 Agent、外部数据库和自定义代码接进工作区。重点不是多一个 AI 按钮,而是 Notion 想从协作文档工具,往企业知识工作自动化底座靠。对企业 IT 和自动化负责人来说,短期动作不是立刻迁移,而是重估哪些流程能放进 Notion,哪些仍该留给 Zapier、Make 或自建系统。

xAI 46台燃气涡轮机争议:AI数据中心正在试探空气监管边界
当地报道显示,xAI 在密西西比州 Colossus 2 数据中心运行 46 台天然气涡轮机,其中 15 台已获空气污染许可。争议点在于,多数设备因装在平板拖车上,被州方视为“移动设备”,可在一年内规避部分空气污染监管。NAACP 与 Southern Environmental Law Center 已代表居民起诉并申请禁令,这件事真正指向的是:AI 算力扩张能不能把临时电源的环境成本推给周边社区。

普林斯顿把教授请回考场:AI没摧毁荣誉制度,它只是让沉默变贵了
普林斯顿将在部分线下考试中恢复教师监考,给运转了133年的荣誉制度补上现实支架。新披露的毕业生调查更刺眼:29.9%的高年级学生承认至少作弊过一次,44.6%见过作弊却没有举报,问题已经不只是AI工具,而是同侪监督失灵。