Codex 生态持续爆发——从网络优化到 SubAgent 监控,从会话历史自动提炼 Skills 到 Appshots 集成,OpenAI 的 Agent 平台正在形成完整工作流。同时 DeepSeek V4 Pro 宣布 75% 折扣永久化,缓存输入价格仅为 GPT-5.5 的 1/34,国产模型在 Agent 场景的性价比优势进一步拉大。
Codex 生态持续爆发——从网络优化到 SubAgent 监控,从会话历史自动提炼 Skills 到 Appshots 集成,OpenAI 的 Agent 平台正在形成完整工作流。同时 DeepSeek V4 Pro 宣布 75% 折扣永久化,缓存输入价格仅为 GPT-5.5 的 1/34,国产模型在 Agent 场景的性价比优势进一步拉大。
把 Apple visionOS / iOS 26 的 Liquid Glass 毛玻璃视觉效果搬到浏览器,基于 WebGPU + HTML-in-Canvas API 实现真正光学合成
git clone 项目后在 Chrome 中打开,先确保设备支持 WebGPU(navigator.gpu 存在),然后启用 chrome://flags/#enable-html-in-canvas 实验性标志。项目提供了 demo 页面直接预览效果。需要较新的 Chrome 版本,目前是实验性技术,适合前端开发者尝鲜。核心是通过 WebGPU shader 模拟 iOS 26 的多层光学合成——不是简单的 CSS backdrop-filter,而是真正的折射、散射和焦散效果。
这是 WebGPU 在 UI 渲染领域的突破性应用。传统 Web 毛玻璃效果靠 CSS blur + backdrop-filter 只能做单层模糊,Liquid DOM 实现了多层光学合成,包括折射和焦散——之前只能在原生 App 中做到。它证明了 WebGPU 不只是游戏/ML 的专属,UI 渲染同样可以受益于 GPU 管线。技术栈极新(依赖实验性 HTML-in-Canvas API),前端领域值得持续关注。
原生 Mac 清理+监控工具,新增菜单栏 CPU/内存/网速实时显示、风扇控制、自启动管理、精灵动画效果
访问 mole.fit 下载安装(注意:唯一官网是 mole.fit,molefit[.]com 是假冒网站含恶意软件)。安装后菜单栏会显示 CPU、内存、网速的小精灵动画,右键可快速操作。风扇控制支持自动/自定义转速。CLI 版本完全免费开源,GUI 版本一次性买断(目前 8 折优惠中)。Orange AI 实测清理了 39GB 空间,拯救了 512GB 小硬盘。1.5.0 版本 6 天时间 171 个 commits,215 个文件改动,57000+ 行代码变更。
TW93 出品的产品一贯高审美+高实用性。Mole 不是又一个"CleanMyMac 替代品",它把系统监控做成了"小精灵陪伴"体验——菜单栏的 runner 动画会随 Mac 状态变化。商业模式也值得学习:CLI 免费开源 + GUI 一次性买断,各取所需。1.5.0 新增的风扇控制和自启动管理让它从"清理工具"进化为"系统伴侣"。
Chrome 扩展,实时同步 ChatGPT / Gemini / Claude / DeepSeek / Grok 五家对话到本地 Markdown,内置 Agent 侧边栏用所有历史对话做 RAG
安装 Chrome 扩展后,登录你的 AI 平台账号,扩展会自动实时同步所有对话到本地 Markdown 文件。Sidebar 里挂着一个 Agent,能读取当前正在浏览的网页内容,提问时会用你所有历史对话做 RAG 检索——等于给你所有 AI 对话建了个私人知识库。支持的平台已覆盖主流五家:ChatGPT、Gemini、Claude、DeepSeek、Grok。
市面上 Sidebar AI 已经很多,但 Ruminer 的差异化在于"全平台对话聚合 + 本地 Markdown 存储 + 跨对话 RAG"。它把分散在各平台的 AI 对话变成了可检索、可引用的个人知识库。对于重度 AI 用户来说,过去和 AI 讨论过的技术决策、代码方案、学习笔记,现在都能被新的对话检索利用——这比任何单独的"Memory"功能都更彻底。
Firecrawl 新推 Parse 端点,上传本地文件(PDF/DOCX/XLSX/HTML)直接输出干净的 Markdown/JSON,专为 AI Agent 喂数据设计
调用 Firecrawl 的新的 /parse 端点,上传非公开文档或本地文件(支持 PDF、DOCX、XLSX、HTML 等格式),直接获得 LLM 可用的干净结构化数据。输出格式可选 Markdown 或 JSON。与之前的爬虫端点不同,parse 端点专门针对本地文件和非公开文档,不需要 URL。你是给 AI Agent 构建数据管道的,这个端点省去了自己写 PDF 解析、表格提取的麻烦。
AI Agent 落地的最大瓶颈之一就是"喂数据"——企业内部文档格式五花八门,自己写解析代码费时费力。Firecrawl 的 Parse 端点把这件事变成了一个 API 调用。配合 Firecrawl 已有的网页爬取能力,现在从网页到本地文档,完整的数据摄取链路都打通了。对构建 RAG 应用或 AI Agent 数据管道的团队,这减少了大量胶水代码。
完全兼容 gh CLI 的开源 Agent Git 服务,郭宇已将其作为主力开发环境替代 GitHub
git clone 后部署 AGS 服务,它完全兼容 GitHub CLI(gh),可以用同样的命令操作。郭宇的工作流是将 AGS 部署在服务器上,然后用 Codex 通过 SSH 连接操作——相当于把整个开发环境"Agent 化"。思路是根据 gh CLI 的逻辑自己 vibe 一个出来也可以,AGS 提供了一个现成的开源实现。由于 cc(Claude Code)不允许在服务器上运行,郭宇已完全切换到 Codex + AGS 组合。
这是 AI 时代开发基础设施变革的缩影——当 Agent 可以替你操作 Git 时,GitHub 的 Web UI、Issue 系统、PR 流程等"为人设计"的界面反而成了 Agent 的瓶颈。AGS 的思路是让 Git 服务对 Agent 友好:CLI-first、兼容现有工具链、无多余 UI 干扰。如果 Agent-driven development 成为主流,AGS 这类工具可能成为新的基础设施标准。
开源 Web 音乐播放器,专门用来分享 Suno AI 生成的音乐,支持电脑和移动端
访问 music.qiaomu.ai 直接体验(已有 Suno 生成的歌曲在线可听)。或者 git clone 项目自己部署,用 Skill 下载音乐上传到后台。前端是一个精美的播放器 UI,同时适配桌面和移动端。适合用 Suno 生成了大量音乐、需要一个专属展示页面的创作者。
AI 音乐生成工具(Suno/Udio)让音乐创作门槛降到零,但缺少好的展示和分享平台。乔木播放器填补了这个空缺——不是又一个"音频托管",而是专门为 AI 生成音乐设计的播放器,有作品集展示的感觉。开源意味着可以自己定制 UI 和功能。这代表了 AI 创作工具爆发后,配套展示工具的需求正在涌现。
日本最大服装电商 ZOZO 开源的物理仿真求解器,专门解决布料/绳索/软体碰撞接触,1.8 亿+接触点无穿透,带 Blender 插件
git clone 后编译安装,提供 Blender 插件可以直接在 Blender 中使用。核心能力是保证布料仿真中完全无穿透、面料拉伸严格不越界(不像游戏里常出现的穿模问题)。单个场景能处理超过 1.8 亿个接触点。适合做服装设计、虚拟试衣、CG 特效的开发者。
ZOZO 作为服装电商把核心技术开源,说明物理仿真在电商"虚拟试穿"场景的商业价值已被验证。这套求解器的精度远超游戏引擎的实时物理(游戏允许穿模,电商不允许——穿模意味着衣服展示错误,直接影响购买决策)。带 Blender 插件降低了上手门槛。1.8 亿接触点的处理能力也展示了工业级仿真的计算规模。
DeepSeek 宣布 V4 Pro API 75% 折扣永久生效,缓存输入 $0.003625/百万 token,输出 $0.87/百万 token,比 GPT-5.5 便宜约 34 倍
这不是临时促销,而是定价策略的根本转变。DeepSeek 缓存命中后的边际成本极低(Orange AI 指出"缓存基本不要钱"),这让他们能以不可思议的价格提供服务。在 Agent 场景下,大量上下文重复(system prompt + 历史对话),缓存命中率很高,实际成本比标价更低。如果 V4.1 有了真实 harness 数据训练后性能提升,性价比优势将更难被追赶。
Agent 开发者的模型选择正在从"哪个最强"变成"哪个性价比最高"。对于大规模 Agent 部署,DeepSeek 的价格优势是碾压级的。OpenAI 和 Anthropic 如果不跟进缓存定价策略,可能在 Agent 市场失去价格敏感客户。同时推动整个行业向"缓存优先"的推理架构演进。
Anthropic 官宣 Memory Files 功能——用户可以在对话中持久化项目上下文,解决每次新对话都要重复交代背景的痛点。工程师 Kevin 做了 workshop 演示 memory store 作为 AI 记忆外挂的用法
这是 Claude 对 Codex 竞争压力的直接回应。Codex 的 /goal 模式和 SubAgent 体系让它在长期项目中优势明显——而 Claude 用户最大的抱怨就是"每次开新对话都要重讲一遍"。Memory Files 让用户可以选择把关键决策、技术栈、项目结构等信息持久化存储,实现跨对话记忆。但相比 Codex 的自动 Skills 提炼(从历史对话中识别重复模式),Claude 的方案更依赖用户手动维护。
AI 助手的竞争正在从"单次对话质量"转向"长期协作能力"。Memory 将成为标配功能。对用户来说,选 AI 工具时"记不记得住"会成为和"聪不聪明"同等重要的维度。长期来看,Agent 的 Memory 能力将决定它能否从"工具"进化为"搭档"。
Codex 团队分享了新能力:让 Codex 回顾过去的会话历史,识别重复出现的任务模式(如 "CI 为什么挂了"、"review 这个 PR"、"写 changelog"),自动沉淀为可复用的 Skills 或 SubAgent
这是 Agent 的"元学习"——不只是完成单次任务,而是从多次交互中抽象出通用模式。传统 AI 助手每次对话都是孤立的,Codex 的 Skills 提炼意味着它开始积累"工作经验"。这比手动创建 prompt 模板或 skill 文件更智能——Codex 自己发现你反复做的事情,自己总结方法。配合 /goal 模式,形成"定义目标 → 自动分解 → 积累经验"的完整循环。
AI 编程助手的价值将从"写代码更快"升级到"越用越懂你"。如果 Skills 提炼足够精准,个人开发者的效率提升会是非线性的——Codex 不再只是工具,而是"知道你怎么干活"的搭档。这也会拉大 AI-native 开发者和传统开发者的差距。
Alma 平台已集成 Codex 的 Appshots 功能,可以在 Codex 中看到目标应用的 UI 截图
Appshots 让 Codex 不只是操作命令行,而是能"看见"GUI——这对于需要操作桌面应用的自动化场景至关重要。郭宇提到 Codex 已经可以操作远程机器上的 Codex 跑 /goal,结合 Appshots 意味着 Agent 可以"看到远程机器上的 UI"。这不再是简单的 CLI 自动化,而是真正的桌面 Agent。
Agent 的操作边界从命令行扩展到了 GUI,能处理更多实际工作场景(如操作网页、桌面软件)。Alma 的集成表明第三方工具正在围绕 Codex 构建生态——这类似于 App Store 早期的平台效应。