📡 AI 资讯日报

🛠️ optillm —— 零微调提升 LLM 推理能力的开源代理

一句话

一个 OpenAI API 兼容的代理层，内置 20+ 种推理优化技术，不训练不微调就能显著提升 LLM 推理精度

链接

怎么玩

pip install optillm 后启动代理服务，将原有调用 OpenAI API 的代码中的 base_url 指向 optillm 的本地端口即可。它会在后端自动应用 Best-of-N 采样、自一致性检查、思维链优化、多数投票等 20 多种技术，一次用户请求在后台拆成多次模型调用来提升结果质量。支持接入任何 OpenAI 兼容 API（OpenAI、Groq、本地 vLLM 等），适合已经在用 LLM 做推理/分类/评估任务的开发者直接插拔试用，无需改模型、不用标注数据。

为什么值得关注

LLM 推理优化领域长期依赖提示工程或昂贵微调，optillm 给出了一个「中间件」式解法，把学术界验证有效的推理增强技术工程化封装成即插即用的代理层。对做 benchmark 评估、RAG 检索质量提升、代码审查等任务尤其有价值，且完全开源。

应用场景

代码 review / bug 检测：多轮推理交叉验证减少误判
RAG 检索结果排序：多数投票提升检索准确性
模型评估 benchmark：自动应用增强技术得到更稳定的评分

原文链接

@Sumanth_077 查看原文 ↗

🛠️ Vercel Zero —— 专门为 AI Agent 设计的编程语言

一句话

Vercel 发布的新语言 Zero，人类不用看、Agent 原生理解，专为 AI 编程场景设计

链接

https://github.com/vercel-labs/zero ↗

怎么玩

克隆 GitHub 仓库后阅读文档即可开始，Zero 的设计哲学是让 AI Agent 能更高效地生成、理解和执行代码。可以让 Claude Code 或 Codex 用 Zero 来构建和部署应用，安装 Vercel CLI 后可直接在项目中引入。Vercel 官方表示这是面向「Agent-First」编程范式的实验。

为什么值得关注

这是第一个由主流平台发布的「Agent-Native」编程语言，代表了 AI Coding 工具链从「辅助人类写代码」到「Agent 自己写代码」的范式跃迁。Zero 去掉了人类可读性包袱，专注于让 AI 生成正确、高效、可部署的代码。

应用场景

Agent 自动生成可部署的 Web 应用
替代传统脚手架，AI 直接输出生产级代码
研究 AI-Native 编程语言设计的参考实现

原文链接

@shao__meng 查看原文 ↗

🛠️ GTA-6 Single Prompt

一句话

用 AI 一个 prompt 生成的 GTA-6 风格游戏，浏览器打开就能玩

怎么玩

直接在浏览器中打开上面地址，进入后用键盘控制角色在城市中移动、驾驶车辆，体验 AI 生成开放世界的效果。WASD 移动、鼠标控制视角，在城市中自由探索。

为什么值得关注

展示了 AI 游戏生成从概念验证到可玩的质变，不是渲染图而是真的交互体验。单一 prompt 生成完整 3D 城市的管线如果成熟，独立游戏开发门槛将被彻底拉低。

应用场景

快速原型：游戏策划一个 prompt 得到可玩 demo
AI 游戏生成管线研究
展示 AI 代码生成能力上限的案例

原文链接

@berryxia 查看原文 ↗

🛠️ Z-Anime

一句话

基于 Z-Image Base 微调的动漫图片生成模型，效果出色且支持本地部署

链接

https://huggingface.co/SeeSee21/Z-Anime ↗

怎么玩

访问 HuggingFace 页面下载模型权重，使用 diffusers 库加载后即可本地生成动漫图片。显存不足可用 GGUF 量化版在 CPU 上运行，也支持 ComfyUI 加载。显存要求适中（8GB+ 推荐）。

为什么值得关注

Z-Image 系列正在形成完整生态矩阵，从通用图片生成到专门的动漫风格微调，全部支持本地运行。对二次元创作者来说是无需付费、无审查限制的高质量方案。

应用场景

同人/二次元创作：角色立绘、插画生成
游戏素材：本地批量生成动漫风格资产
与 ComfyUI 工作流集成

原文链接

@Gorden_Sun 查看原文 ↗

🛠️ 微信读书官方 Skills

一句话

微信读书发布官方 Skill，Agent 可以查阅书架、阅读统计、笔记划线、搜索书籍，把你的阅读数据变成 AI 可用的知识库

链接

https://weread.qq.com/r/weread-skills ↗

怎么玩

两种方式安装：(1) 下载官方 Skill 包在 Claude Code 或 Codex 中安装；(2) 使用社区优化版 npx skills add jerlinn/jerlin-weread。安装后在 weread.qq.com/r/weread-skills 获取 API Key 配置。可以让 Agent：分析阅读偏好推荐新书、找出阅读盲区补全知识结构、基于笔记和划线生成读书报告、分析阅读时长和思维结构等。

为什么值得关注

这是第一个由国民级应用官方发布的 AI Agent Skill，代表了「个人数据 Agent 化」的里程碑。微信读书的笔记、划线、书评是高质量的个人知识图谱，Agent 接入后等于拥有了一个懂你阅读品味和研究方向的私人图书馆员。

应用场景

年度阅读报告自动生成
基于阅读盲区制定个性化学习计划
将读书笔记自动整理为知识库/第二大脑

原文链接

@op7418 查看原文 ↗

🛠️ TabulaBili

一句话

一键清空 B 站个性化推荐，让算法重新认识你，或彻底告别信息茧房

怎么玩

在 Chrome 应用商店搜索 TabulaBili 安装，点击扩展图标即可一键清除 B 站所有个性化推荐数据，包括观看历史、搜索记录、互动行为等。清除后 B 站首页回归出厂设置，推荐算法不再基于你的历史行为。完全本地操作，不上传数据。

为什么值得关注

内容平台的推荐算法越来越强势地决定我们看什么，TabulaBili 提供了一个数字自主权工具——用户可以主动重置算法对自己的认知。在 AI 推荐越来越精准的时代，这种反推荐工具反而成了刚需。

应用场景

重置 B 站推荐，探索新领域内容
研究 B 站推荐算法行为的实验工具
送给被算法困在单一信息流的亲友

原文链接

@appinn 查看原文 ↗

📡 Google Gemini Spark Agent 代码泄露

事件

研究者从 Google App 代码中逆向出 Gemini Intelligence 的下一代 Agent——代号 Spark，具备技能系统（Skills）和任务调度器

解读

Forbes、Android Authority、Yahoo News 等多家媒体报道了此次代码泄露。Spark 的核心架构包含技能系统——Agent 可以学习和调用离散技能，以及一个任务调度器来协调多个技能的执行。这意味着 Google 正在构建一个类似 Claude Code Skills / Codex Skills 的 Agent 平台，且深度集成在 Google App 中。泄露代码显示 Spark 可以访问 Gmail、Calendar、Drive 等 Google 生态内的数据。

影响评估

Google 拥有全球最大的个人数据生态（Gmail 20亿用户、Android 30亿设备），如果 Spark Agent 能无缝接入这些数据，其 Agent 的能力边界将远超竞品。但隐私问题也将成为最大的争议焦点。

原文链接

@seclink 查看原文 ↗

📡 AI Coding Agent 实测对比：OpenClaw vs Hermes

事件

Atomic Bot 使用本地 Qwen 35B 模型跑真实编程任务（抓取 GitHub star 历史、分析增长、构建实时仪表盘），对比 OpenClaw 和 Hermes Agent，引发创始人级别公开辩论

解读

视频任务是在本地环境抓取 GitHub 两个仓库的 star 历史数据、分析增长 spike 原因、构建浏览器实时仪表盘。OpenClaw 创始人 @steipete 亲自转发并参与讨论。整个 AI Coding Agent 赛道正在经历真刀真枪的 benchmark 阶段，空洞营销文正在让位于实测视频。

影响评估

本地模型（Qwen 35B）已经能完成较复杂的多步骤编程任务，这对云端 API 定价和闭源模型构成了实质性威胁。Agent 框架之间的竞争从功能列表比拼进入了实测完成率的硬核阶段。

原文链接

@shao__meng 查看原文 ↗

📡 OpenAI Codex 远程控制大升级 + GitHub Copilot App

事件

OpenAI 正在将 Codex 远程控制从手机控自己电脑推向手机控任意电脑，同时 GitHub Copilot 独立 App 开放 waitlist 申请

解读

5月14日 ChatGPT App 新增功能：手机端可以实时查看 Mac 上 Codex 的工作状态、审批命令、切换模型、派发新任务，目前限于同一 Apple ID。但正在向手机控任意电脑方向推进。同时 GitHub Copilot 的独立原生 App 已开放 waitlist（gh.io/github-copilot-app）。

影响评估

当 AI 编程工具从 IDE/终端扩展到手机端，编程不再是坐在电脑前的专属活动——可以在通勤时审查 PR、在咖啡厅用手机给 AI 派发开发任务。对开发者工作形态的影响不亚于 Slack 替代 Email。

原文链接

@xiaohu 查看原文 ↗ @appinn 查看原文 ↗ @appinn 查看原文 ↗ @appinn 查看原文 ↗ @appinn 查看原文 ↗ @LandingAI 查看原文 ↗ @berryxia 查看原文 ↗ @appinn 查看原文 ↗ @xicilion 查看原文 ↗ @shao__meng 查看原文 ↗ @op7418 查看原文 ↗ @berryxia 查看原文 ↗ @berryxia 查看原文 ↗

🎯 值得关注

iStart：为 macOS 26 打造的轻量级开始菜单与应用启动器，开源 →
SnapIt-Plus：高度可自定义拖拽布局的 macOS 窗口管理软件 →
TraceMind：让 AI Coding 产品看懂真实用户行为的分析工具 →
图片翻译浏览器插件：完全本地运行、不依赖云服务的图片内文字翻译 →
LandingAI RAG on Complex Documents：解决扫描件/嵌套表格/不规则排版的 RAG 检索难题 →
Tanka：用图谱+稀疏注意力打造的 AI 企业记忆系统 →
Lumara：手机上实时观看 NASA 太阳和月亮直播 →
docu.md：文档工具 Chrome 单平台周活破万，全平台破三万 →
Claude 团队发布 AI-Native 初创团队操作手册 →
Anthropic 官方 Skill 构建指南发布（有双语翻译版） →
Yann LeCun 预测：12-18个月内将有通用方法训练分层规划 AI 系统 →
Hermes Agent 蓝 V 接入教程：5分钟让 X Premium 订阅变身全能 AI 助手 →