AI Coding Agent 生态全面升温:Vercel 发布专为 Agent 设计的编程语言 Zero,OpenAI Codex 远程控制能力大幅扩展,GitHub Copilot 独立 App 即将上线;微信读书官方 Skills 发布引爆「Agent+个人数据」新范式。
AI Coding Agent 生态全面升温:Vercel 发布专为 Agent 设计的编程语言 Zero,OpenAI Codex 远程控制能力大幅扩展,GitHub Copilot 独立 App 即将上线;微信读书官方 Skills 发布引爆「Agent+个人数据」新范式。
一个 OpenAI API 兼容的代理层,内置 20+ 种推理优化技术,不训练不微调就能显著提升 LLM 推理精度
pip install optillm 后启动代理服务,将原有调用 OpenAI API 的代码中的 base_url 指向 optillm 的本地端口即可。它会在后端自动应用 Best-of-N 采样、自一致性检查、思维链优化、多数投票等 20 多种技术,一次用户请求在后台拆成多次模型调用来提升结果质量。支持接入任何 OpenAI 兼容 API(OpenAI、Groq、本地 vLLM 等),适合已经在用 LLM 做推理/分类/评估任务的开发者直接插拔试用,无需改模型、不用标注数据。
LLM 推理优化领域长期依赖提示工程或昂贵微调,optillm 给出了一个「中间件」式解法,把学术界验证有效的推理增强技术工程化封装成即插即用的代理层。对做 benchmark 评估、RAG 检索质量提升、代码审查等任务尤其有价值,且完全开源。
Vercel 发布的新语言 Zero,人类不用看、Agent 原生理解,专为 AI 编程场景设计
克隆 GitHub 仓库后阅读文档即可开始,Zero 的设计哲学是让 AI Agent 能更高效地生成、理解和执行代码。可以让 Claude Code 或 Codex 用 Zero 来构建和部署应用,安装 Vercel CLI 后可直接在项目中引入。Vercel 官方表示这是面向「Agent-First」编程范式的实验。
这是第一个由主流平台发布的「Agent-Native」编程语言,代表了 AI Coding 工具链从「辅助人类写代码」到「Agent 自己写代码」的范式跃迁。Zero 去掉了人类可读性包袱,专注于让 AI 生成正确、高效、可部署的代码。
用 AI 一个 prompt 生成的 GTA-6 风格游戏,浏览器打开就能玩
直接在浏览器中打开上面地址,进入后用键盘控制角色在城市中移动、驾驶车辆,体验 AI 生成开放世界的效果。WASD 移动、鼠标控制视角,在城市中自由探索。
展示了 AI 游戏生成从概念验证到可玩的质变,不是渲染图而是真的交互体验。单一 prompt 生成完整 3D 城市的管线如果成熟,独立游戏开发门槛将被彻底拉低。
基于 Z-Image Base 微调的动漫图片生成模型,效果出色且支持本地部署
访问 HuggingFace 页面下载模型权重,使用 diffusers 库加载后即可本地生成动漫图片。显存不足可用 GGUF 量化版在 CPU 上运行,也支持 ComfyUI 加载。显存要求适中(8GB+ 推荐)。
Z-Image 系列正在形成完整生态矩阵,从通用图片生成到专门的动漫风格微调,全部支持本地运行。对二次元创作者来说是无需付费、无审查限制的高质量方案。
微信读书发布官方 Skill,Agent 可以查阅书架、阅读统计、笔记划线、搜索书籍,把你的阅读数据变成 AI 可用的知识库
两种方式安装:(1) 下载官方 Skill 包在 Claude Code 或 Codex 中安装;(2) 使用社区优化版 npx skills add jerlinn/jerlin-weread。安装后在 weread.qq.com/r/weread-skills 获取 API Key 配置。可以让 Agent:分析阅读偏好推荐新书、找出阅读盲区补全知识结构、基于笔记和划线生成读书报告、分析阅读时长和思维结构等。
这是第一个由国民级应用官方发布的 AI Agent Skill,代表了「个人数据 Agent 化」的里程碑。微信读书的笔记、划线、书评是高质量的个人知识图谱,Agent 接入后等于拥有了一个懂你阅读品味和研究方向的私人图书馆员。
一键清空 B 站个性化推荐,让算法重新认识你,或彻底告别信息茧房
在 Chrome 应用商店搜索 TabulaBili 安装,点击扩展图标即可一键清除 B 站所有个性化推荐数据,包括观看历史、搜索记录、互动行为等。清除后 B 站首页回归出厂设置,推荐算法不再基于你的历史行为。完全本地操作,不上传数据。
内容平台的推荐算法越来越强势地决定我们看什么,TabulaBili 提供了一个数字自主权工具——用户可以主动重置算法对自己的认知。在 AI 推荐越来越精准的时代,这种反推荐工具反而成了刚需。
研究者从 Google App 代码中逆向出 Gemini Intelligence 的下一代 Agent——代号 Spark,具备技能系统(Skills)和任务调度器
Forbes、Android Authority、Yahoo News 等多家媒体报道了此次代码泄露。Spark 的核心架构包含技能系统——Agent 可以学习和调用离散技能,以及一个任务调度器来协调多个技能的执行。这意味着 Google 正在构建一个类似 Claude Code Skills / Codex Skills 的 Agent 平台,且深度集成在 Google App 中。泄露代码显示 Spark 可以访问 Gmail、Calendar、Drive 等 Google 生态内的数据。
Google 拥有全球最大的个人数据生态(Gmail 20亿用户、Android 30亿设备),如果 Spark Agent 能无缝接入这些数据,其 Agent 的能力边界将远超竞品。但隐私问题也将成为最大的争议焦点。
Atomic Bot 使用本地 Qwen 35B 模型跑真实编程任务(抓取 GitHub star 历史、分析增长、构建实时仪表盘),对比 OpenClaw 和 Hermes Agent,引发创始人级别公开辩论
视频任务是在本地环境抓取 GitHub 两个仓库的 star 历史数据、分析增长 spike 原因、构建浏览器实时仪表盘。OpenClaw 创始人 @steipete 亲自转发并参与讨论。整个 AI Coding Agent 赛道正在经历真刀真枪的 benchmark 阶段,空洞营销文正在让位于实测视频。
本地模型(Qwen 35B)已经能完成较复杂的多步骤编程任务,这对云端 API 定价和闭源模型构成了实质性威胁。Agent 框架之间的竞争从功能列表比拼进入了实测完成率的硬核阶段。
OpenAI 正在将 Codex 远程控制从手机控自己电脑推向手机控任意电脑,同时 GitHub Copilot 独立 App 开放 waitlist 申请
5月14日 ChatGPT App 新增功能:手机端可以实时查看 Mac 上 Codex 的工作状态、审批命令、切换模型、派发新任务,目前限于同一 Apple ID。但正在向手机控任意电脑方向推进。同时 GitHub Copilot 的独立原生 App 已开放 waitlist(gh.io/github-copilot-app)。
当 AI 编程工具从 IDE/终端扩展到手机端,编程不再是坐在电脑前的专属活动——可以在通勤时审查 PR、在咖啡厅用手机给 AI 派发开发任务。对开发者工作形态的影响不亚于 Slack 替代 Email。