📡 AI 资讯日报

2026-05-25
🔥 今日主线

Codex 生态持续爆发——从网络优化到 SubAgent 监控,从会话历史自动提炼 Skills 到 Appshots 集成,OpenAI 的 Agent 平台正在形成完整工作流。同时 DeepSeek V4 Pro 宣布 75% 折扣永久化,缓存输入价格仅为 GPT-5.5 的 1/34,国产模型在 Agent 场景的性价比优势进一步拉大。

🛠️ Liquid DOM — Apple Liquid Glass 效果上 Web

把 Apple visionOS / iOS 26 的 Liquid Glass 毛玻璃视觉效果搬到浏览器,基于 WebGPU + HTML-in-Canvas API 实现真正光学合成

https://github.com/AndrewPrifer/liquid-dom ↗

git clone 项目后在 Chrome 中打开,先确保设备支持 WebGPU(navigator.gpu 存在),然后启用 chrome://flags/#enable-html-in-canvas 实验性标志。项目提供了 demo 页面直接预览效果。需要较新的 Chrome 版本,目前是实验性技术,适合前端开发者尝鲜。核心是通过 WebGPU shader 模拟 iOS 26 的多层光学合成——不是简单的 CSS backdrop-filter,而是真正的折射、散射和焦散效果。

这是 WebGPU 在 UI 渲染领域的突破性应用。传统 Web 毛玻璃效果靠 CSS blur + backdrop-filter 只能做单层模糊,Liquid DOM 实现了多层光学合成,包括折射和焦散——之前只能在原生 App 中做到。它证明了 WebGPU 不只是游戏/ML 的专属,UI 渲染同样可以受益于 GPU 管线。技术栈极新(依赖实验性 HTML-in-Canvas API),前端领域值得持续关注。

原文链接
🛠️ Mole 1.5.0 — Mac 系统管家重大更新

原生 Mac 清理+监控工具,新增菜单栏 CPU/内存/网速实时显示、风扇控制、自启动管理、精灵动画效果

https://mole.fit ↗

访问 mole.fit 下载安装(注意:唯一官网是 mole.fit,molefit[.]com 是假冒网站含恶意软件)。安装后菜单栏会显示 CPU、内存、网速的小精灵动画,右键可快速操作。风扇控制支持自动/自定义转速。CLI 版本完全免费开源,GUI 版本一次性买断(目前 8 折优惠中)。Orange AI 实测清理了 39GB 空间,拯救了 512GB 小硬盘。1.5.0 版本 6 天时间 171 个 commits,215 个文件改动,57000+ 行代码变更。

TW93 出品的产品一贯高审美+高实用性。Mole 不是又一个"CleanMyMac 替代品",它把系统监控做成了"小精灵陪伴"体验——菜单栏的 runner 动画会随 Mac 状态变化。商业模式也值得学习:CLI 免费开源 + GUI 一次性买断,各取所需。1.5.0 新增的风扇控制和自启动管理让它从"清理工具"进化为"系统伴侣"。

原文链接
🛠️ Ruminer — 把所有 AI 对话同步成本地 Markdown

Chrome 扩展,实时同步 ChatGPT / Gemini / Claude / DeepSeek / Grok 五家对话到本地 Markdown,内置 Agent 侧边栏用所有历史对话做 RAG

安装 Chrome 扩展后,登录你的 AI 平台账号,扩展会自动实时同步所有对话到本地 Markdown 文件。Sidebar 里挂着一个 Agent,能读取当前正在浏览的网页内容,提问时会用你所有历史对话做 RAG 检索——等于给你所有 AI 对话建了个私人知识库。支持的平台已覆盖主流五家:ChatGPT、Gemini、Claude、DeepSeek、Grok。

市面上 Sidebar AI 已经很多,但 Ruminer 的差异化在于"全平台对话聚合 + 本地 Markdown 存储 + 跨对话 RAG"。它把分散在各平台的 AI 对话变成了可检索、可引用的个人知识库。对于重度 AI 用户来说,过去和 AI 讨论过的技术决策、代码方案、学习笔记,现在都能被新的对话检索利用——这比任何单独的"Memory"功能都更彻底。

原文链接
🛠️ Firecrawl Parse — 任意文档转 AI-Ready 结构化数据

Firecrawl 新推 Parse 端点,上传本地文件(PDF/DOCX/XLSX/HTML)直接输出干净的 Markdown/JSON,专为 AI Agent 喂数据设计

https://firecrawl.dev ↗

调用 Firecrawl 的新的 /parse 端点,上传非公开文档或本地文件(支持 PDF、DOCX、XLSX、HTML 等格式),直接获得 LLM 可用的干净结构化数据。输出格式可选 Markdown 或 JSON。与之前的爬虫端点不同,parse 端点专门针对本地文件和非公开文档,不需要 URL。你是给 AI Agent 构建数据管道的,这个端点省去了自己写 PDF 解析、表格提取的麻烦。

AI Agent 落地的最大瓶颈之一就是"喂数据"——企业内部文档格式五花八门,自己写解析代码费时费力。Firecrawl 的 Parse 端点把这件事变成了一个 API 调用。配合 Firecrawl 已有的网页爬取能力,现在从网页到本地文档,完整的数据摄取链路都打通了。对构建 RAG 应用或 AI Agent 数据管道的团队,这减少了大量胶水代码。

原文链接
🛠️ AGS (Agent Git Service) — 用 Agent 替代 GitHub 的开发环境

完全兼容 gh CLI 的开源 Agent Git 服务,郭宇已将其作为主力开发环境替代 GitHub

https://github.com/ngaut/agent-git-service ↗

git clone 后部署 AGS 服务,它完全兼容 GitHub CLI(gh),可以用同样的命令操作。郭宇的工作流是将 AGS 部署在服务器上,然后用 Codex 通过 SSH 连接操作——相当于把整个开发环境"Agent 化"。思路是根据 gh CLI 的逻辑自己 vibe 一个出来也可以,AGS 提供了一个现成的开源实现。由于 cc(Claude Code)不允许在服务器上运行,郭宇已完全切换到 Codex + AGS 组合。

这是 AI 时代开发基础设施变革的缩影——当 Agent 可以替你操作 Git 时,GitHub 的 Web UI、Issue 系统、PR 流程等"为人设计"的界面反而成了 Agent 的瓶颈。AGS 的思路是让 Git 服务对 Agent 友好:CLI-first、兼容现有工具链、无多余 UI 干扰。如果 Agent-driven development 成为主流,AGS 这类工具可能成为新的基础设施标准。

原文链接
🛠️ 乔木音乐播放器 — Suno 生成音乐的展示平台

开源 Web 音乐播放器,专门用来分享 Suno AI 生成的音乐,支持电脑和移动端

https://github.com/joeseesun/qiaomu-music-player-web ↗

访问 music.qiaomu.ai 直接体验(已有 Suno 生成的歌曲在线可听)。或者 git clone 项目自己部署,用 Skill 下载音乐上传到后台。前端是一个精美的播放器 UI,同时适配桌面和移动端。适合用 Suno 生成了大量音乐、需要一个专属展示页面的创作者。

AI 音乐生成工具(Suno/Udio)让音乐创作门槛降到零,但缺少好的展示和分享平台。乔木播放器填补了这个空缺——不是又一个"音频托管",而是专门为 AI 生成音乐设计的播放器,有作品集展示的感觉。开源意味着可以自己定制 UI 和功能。这代表了 AI 创作工具爆发后,配套展示工具的需求正在涌现。

原文链接
🛠️ ppf-contact-solver — ZOZO 开源物理仿真接触求解器

日本最大服装电商 ZOZO 开源的物理仿真求解器,专门解决布料/绳索/软体碰撞接触,1.8 亿+接触点无穿透,带 Blender 插件

https://github.com/st-tech/ppf-contact-solver ↗

git clone 后编译安装,提供 Blender 插件可以直接在 Blender 中使用。核心能力是保证布料仿真中完全无穿透、面料拉伸严格不越界(不像游戏里常出现的穿模问题)。单个场景能处理超过 1.8 亿个接触点。适合做服装设计、虚拟试衣、CG 特效的开发者。

ZOZO 作为服装电商把核心技术开源,说明物理仿真在电商"虚拟试穿"场景的商业价值已被验证。这套求解器的精度远超游戏引擎的实时物理(游戏允许穿模,电商不允许——穿模意味着衣服展示错误,直接影响购买决策)。带 Blender 插件降低了上手门槛。1.8 亿接触点的处理能力也展示了工业级仿真的计算规模。

原文链接
📡 DeepSeek V4 Pro 75% 折扣永久化

DeepSeek 宣布 V4 Pro API 75% 折扣永久生效,缓存输入 $0.003625/百万 token,输出 $0.87/百万 token,比 GPT-5.5 便宜约 34 倍

这不是临时促销,而是定价策略的根本转变。DeepSeek 缓存命中后的边际成本极低(Orange AI 指出"缓存基本不要钱"),这让他们能以不可思议的价格提供服务。在 Agent 场景下,大量上下文重复(system prompt + 历史对话),缓存命中率很高,实际成本比标价更低。如果 V4.1 有了真实 harness 数据训练后性能提升,性价比优势将更难被追赶。

Agent 开发者的模型选择正在从"哪个最强"变成"哪个性价比最高"。对于大规模 Agent 部署,DeepSeek 的价格优势是碾压级的。OpenAI 和 Anthropic 如果不跟进缓存定价策略,可能在 Agent 市场失去价格敏感客户。同时推动整个行业向"缓存优先"的推理架构演进。

原文链接
📡 Anthropic Claude Memory Files 上线

Anthropic 官宣 Memory Files 功能——用户可以在对话中持久化项目上下文,解决每次新对话都要重复交代背景的痛点。工程师 Kevin 做了 workshop 演示 memory store 作为 AI 记忆外挂的用法

这是 Claude 对 Codex 竞争压力的直接回应。Codex 的 /goal 模式和 SubAgent 体系让它在长期项目中优势明显——而 Claude 用户最大的抱怨就是"每次开新对话都要重讲一遍"。Memory Files 让用户可以选择把关键决策、技术栈、项目结构等信息持久化存储,实现跨对话记忆。但相比 Codex 的自动 Skills 提炼(从历史对话中识别重复模式),Claude 的方案更依赖用户手动维护。

AI 助手的竞争正在从"单次对话质量"转向"长期协作能力"。Memory 将成为标配功能。对用户来说,选 AI 工具时"记不记得住"会成为和"聪不聪明"同等重要的维度。长期来看,Agent 的 Memory 能力将决定它能否从"工具"进化为"搭档"。

原文链接
📡 OpenAI Codex Skills 自动化 — 从历史对话提炼可复用能力

Codex 团队分享了新能力:让 Codex 回顾过去的会话历史,识别重复出现的任务模式(如 "CI 为什么挂了"、"review 这个 PR"、"写 changelog"),自动沉淀为可复用的 Skills 或 SubAgent

这是 Agent 的"元学习"——不只是完成单次任务,而是从多次交互中抽象出通用模式。传统 AI 助手每次对话都是孤立的,Codex 的 Skills 提炼意味着它开始积累"工作经验"。这比手动创建 prompt 模板或 skill 文件更智能——Codex 自己发现你反复做的事情,自己总结方法。配合 /goal 模式,形成"定义目标 → 自动分解 → 积累经验"的完整循环。

AI 编程助手的价值将从"写代码更快"升级到"越用越懂你"。如果 Skills 提炼足够精准,个人开发者的效率提升会是非线性的——Codex 不再只是工具,而是"知道你怎么干活"的搭档。这也会拉大 AI-native 开发者和传统开发者的差距。

原文链接
📡 Alma 支持 Codex Appshots

Alma 平台已集成 Codex 的 Appshots 功能,可以在 Codex 中看到目标应用的 UI 截图

Appshots 让 Codex 不只是操作命令行,而是能"看见"GUI——这对于需要操作桌面应用的自动化场景至关重要。郭宇提到 Codex 已经可以操作远程机器上的 Codex 跑 /goal,结合 Appshots 意味着 Agent 可以"看到远程机器上的 UI"。这不再是简单的 CLI 自动化,而是真正的桌面 Agent。

Agent 的操作边界从命令行扩展到了 GUI,能处理更多实际工作场景(如操作网页、桌面软件)。Alma 的集成表明第三方工具正在围绕 Codex 构建生态——这类似于 App Store 早期的平台效应。

原文链接

🎯 值得关注