📡 AI 资讯日报

2026-06-20
🔥 今日主线

今天最值得上手的是“Agent 工程化”和“可运行交互应用”:从 Vercel Eve、Browser Use 模板、Datasette Apps,到各种 Skill/MCP 项目,都在把 AI 从聊天变成可复用、可部署、可协作的工作流。另一个方向是“本地可试的个人自动化”:Codex/Claude Code 的新功能、元 Skill、设计 Skill 都在降低把经验沉淀成工具的门槛。

🛠️ Datasette Apps

Simon Willison 新发布的 Datasette 插件,可以在 Datasette 里托管沙盒化 HTML+JS 小应用,并通过 JSON API 直接查询/写入数据库。

https://datasette.io/blog/2026/datasette-apps/ ↗

https://simonwillison.net/2026/Jun/18/datasette-apps/ ↗

先进入官方博客,按文中的 uv 一行命令在本机启动演示;如果你已经有 Python/uv 环境,可以直接复制命令运行,然后打开本地 Datasette 页面。体验时重点看两个点:第一,iframe 中的 HTML+JS 应用如何通过 Datasette 暴露的 API 读写表数据;第二,自己能否把一个小型数据应用打包成“artifact”式页面。建议拿一个 CSV 或 SQLite 数据库试验,比如个人读书清单、产品反馈表、爬虫结果表,再让前端页面做筛选、图表或编辑表单。

它把 Claude Artifacts 这类“可交互小应用”的体验带到了真实数据库上,而且不是只展示静态 HTML,而是能连接完整关系型数据库。对于做内部工具、数据浏览器、轻量 BI 和 AI 生成数据应用的人来说,这是一个非常实用的底座。

原文链接
🛠️ Vercel Eve Agent Framework

Vercel 开源的生产级 Agent 框架,把 Agent 组织成目录结构,让开发者主要描述“做什么”,框架处理运行、工具、记忆和部署形态。

https://vercel.com/blog/introducing-eve ↗

打开 Vercel 官方博客,先看它的 agent/ 目录约定:agent.ts 放模型与配置,instructions.md 放任务指令,其他文件承载工具、上下文和工作流。上手时可以创建一个最小 Agent 项目,把你常用的任务写成 instructions.md,比如“监控 GitHub Issue 并生成处理建议”或“把网页内容整理成日报”。然后根据文档接入 Vercel 平台能力,尝试部署一个能被触发的 Agent。重点不是一次做复杂系统,而是理解 Eve 如何把 Agent 从 prompt 文件变成可维护的工程目录。

Agent 项目越来越像软件工程项目,需要目录规范、部署约定、触发器、状态管理和团队协作。Eve 的价值在于把反复出现的 Agent 形态抽象成框架,有机会成为 Vercel 生态中构建自动化 Agent 的标准模板。

原文链接
🛠️ Browser Use Browser Agent Template

Browser Use 开源的浏览器 Agent 模板,让任意 Agent 连接真实云端浏览器,并能实时观察网页操作过程。

https://github.com/browser-use/browser-agent-template ↗

进入 GitHub 仓库后,先按 README 克隆模板并安装依赖,通常流程是 git clone、安装包管理器依赖、配置 Browser Use Cloud 或相关浏览器运行凭证,再启动本地开发服务。建议从一个简单网页任务开始:让 Agent 打开一个网站、搜索关键词、读取页面摘要、点击某个按钮并返回结果。跑通后再把模板嵌入你自己的 Agent 项目,让模型不只调用 API,而是真正使用浏览器完成登录后后台、网页表单、数据录入等任务。

很多现实任务没有稳定 API,只能通过网页完成。这个模板把“云端浏览器 + 可视化观察 + Agent 控制”打包成可复用工程,对于需要让 Agent 操作 SaaS 后台、网页系统和长流程任务的人非常关键。

原文链接
🛠️ qiaomu-llm-mcp

向阳乔木开源的 MCP,可在 Codex 中调 Claude Code 干活,也支持多模型多轮讨论后交给 Codex 总结方案。

https://github.com/joeseesun/qiaomu-llm-mcp ↗

打开 GitHub 仓库,把链接发给你正在使用的 AI 编程工具(如 Codex),让它读取 README 并引导安装;也可以手动按仓库说明配置 MCP server。安装后在 Codex 中触发这个 MCP,尝试让 Claude Code 参与写作、前端、翻译或方案讨论任务。一个推荐玩法是:同一需求先让 Claude、国产便宜模型和 Codex 各自提出方案,再由 Codex 汇总成可执行计划,最后选择其中一个 Agent 落地代码或文档。

现在单一模型并不能覆盖所有任务,Claude 擅长写作和前端审美,Codex 擅长工程执行,国产模型适合低成本批处理。这个 MCP 的亮点是把多模型协作变成工具调用,而不是手工复制粘贴。

原文链接
🛠️ qiaomu-daodejing-comics

开源的《道德经》配图阅读项目,用 AI 生图提升古文阅读体验,并提供在线体验站点。

https://daodejing.qiaomu.ai/ ↗

https://github.com/joeseesun/qiaomu-daodejing-comics ↗

最简单的方式是直接打开在线站点浏览每一章,观察 AI 配图如何辅助理解文本意象;如果想改造项目,可以克隆 GitHub 仓库,在本地查看页面结构和内容组织方式。你可以替换成自己的文本材料,比如唐诗、英文短篇、品牌手册或课程讲义,再接入自己的生图模型生成插图。由于作者提到 Seedream 5 有时图文不相关,建议把“人工挑图/重生成”加入流程,保证阅读体验。

它是一个很好的“AI 内容再包装”样板:不是只生成文章,而是把经典文本、配图、网页阅读体验和开源项目结合起来。对做教育内容、电子书、文化类网站的人有直接参考价值。

原文链接
🛠️ yao-meta-skill 2.0

姚金刚开源的“创建 Skill 的 Skill”升级到 2.0,用来帮助用户写出更高质量的 Claude/Codex/Hermes 类 Agent 技能。

https://github.com/yaojingang/yao-meta-skill ↗

进入 GitHub 仓库阅读安装说明,把该元 Skill 放入你的 Agent 技能目录,或把仓库链接交给 Claude Code、Codex、Hermes 等工具让它协助安装。上手任务可以选一个你每天重复做的流程,例如“整理 X 日报”“生成 PR Review Checklist”“把会议纪要转成 Jira 任务”,让元 Skill 先访谈需求、抽取触发条件、步骤、验证标准和坑点,再生成 SKILL.md。生成后不要直接收工,最好用真实任务跑一次,再把失败点补回 Skill。

Skill 的本质是把经验固化为可复用程序化记忆。这个项目聚合了 Anthropic 官方 Skill 思路和社区实践,能让不会写 Skill 的用户也建立可维护的个人自动化库。

原文链接
🛠️ Brand to DESIGN.md Skill

一个把品牌网站提取为 DESIGN.md,再用设计规范指导生成页面的开源 Skill。

https://github.com/shaom/brand-to-design-md-skill ↗

克隆或安装该 Skill 后,选择一个你想复刻风格的网站,例如 Vercel、Linear 或 Stripe,让 Agent 先访问网站并抽取色彩、排版、组件、动效和语气,生成 DESIGN.md。第二步再把 DESIGN.md 作为设计约束,让 Agent 生成 landing page、产品页或演示站。今天 Vercel 创始人公开 DESIGN.md 的事件也很适合用来对比:一边用官方 DESIGN.md,一边用 Skill 自动抽取,看生成质量差异。

AI 生成前端页面的最大问题常常不是功能,而是审美和一致性。把品牌风格转成可复用 DESIGN.md,相当于给 Agent 一个设计系统记忆,能显著减少“每次生成都变风格”的问题。

原文链接
🛠️ orange-line-illustration

orange2ai 开源的插图 Skill,用于给文章、PPT 或网页配置线稿风格插图。

https://github.com/orange2ai/orange-line-illustration ↗

打开仓库后按 README 安装到你的 Agent 技能目录,或者把仓库链接交给 Codex/Claude Code 让它指导配置。安装完成后,拿一段文章或一个 PPT 大纲做测试,让 Agent 根据段落含义生成对应的线稿插图提示词或图片。建议先规定统一画风、色彩和构图,比如“黑白细线、少量橙色点缀、适合技术博客”,再批量生成多张图,这样最终页面不会显得拼贴混乱。

高质量内容越来越需要视觉表达,但每次手动找图或写提示词很耗时。把插图风格做成 Skill,可以让图文生成成为稳定流程,尤其适合技术写作者、课程作者和产品页面制作。

原文链接
🛠️ Loop Library

Matthew Berman 建的 Agent Loop 模板库,集中收集各种可复用的 Agent 循环流程。

https://signals.forwardfuture.ai/loop-library/ ↗

打开 Loop Library 后,先浏览已有 loop,挑一个与你需求接近的模板,例如研究循环、编码循环、自动化执行循环或反馈修正循环。不要只看标题,重点读它的输入、步骤、退出条件和人工检查点。上手时可以复制一个模板到自己的 Agent 工作流中,替换成你的工具和目标,再跑一个小任务验证,比如“每天抓取 10 条行业信息并筛选可上手项目”。如果有稳定流程,也可以按网站要求提交自己的 loop。

Agent 的关键不只是模型,而是循环结构:计划、执行、观察、修正、验证如何组织。模板库把这些隐性经验变成可复用模式,对搭建可靠 Agent 工作流非常有帮助。

原文链接
🛠️ Cloudflare Vulnerability Harness

Cloudflare 公开多阶段漏洞发现框架技术细节,展示如何用自动化分类循环、状态控制和对抗审查管理 LLM 安全分析。

https://blog.cloudflare.com/build-your-own-vulnerability-harness/?utm_campaign=cf_blog&utm_content=20260618&utm_medium=organic_social&utm_source=twitter ↗

进入 Cloudflare 博客后,按文章拆解它的漏洞 harness 结构:输入目标、生成候选漏洞、自动分类、状态推进、误报审查、上下文裁剪。实践时不建议直接扫生产系统,可以先选一个本地靶场或开源小项目,把流程复刻成脚本:让 LLM 读代码片段提出风险,再用规则或二次模型复核,最后输出结构化报告。关键是学习它如何把一次性“让 AI 找漏洞”变成可追踪、多阶段、可降低误报的 pipeline。

安全场景最怕幻觉和误报。Cloudflare 这篇文章提供了真实生产团队如何约束 LLM、管理状态和绕过上下文限制的经验,对安全工程、代码审计和企业 AI 自动化都很有参考价值。

原文链接
🛠️ DeepEval LangChain Pytest 集成

DeepEval 提供面向 LangChain Agent 的 Pytest 测试方式,用来评估非确定性的 LLM、工具和检索链路输出。

https://github.com/confident-ai/deepeval ↗

先安装 deepeval,并在你的 LangChain Agent 项目中创建 pytest 测试文件。不要用传统单元测试的“输出必须等于某字符串”,而是定义评估指标,比如回答相关性、工具调用正确性、事实一致性、检索上下文覆盖率。然后运行 pytest,让 DeepEval 在本地对 Agent 多次输出进行评分。一个适合入门的例子是:给 RAG Agent 准备几条固定问题和标准资料,检查它是否引用正确文档、是否调用了预期工具、是否没有编造答案。

Agent 系统由模型、工具、检索、记忆多部分组成,失败方式很多,传统测试很难覆盖。把评估接入 Pytest,意味着 AI Agent 可以进入 CI 流程,逐步接近常规软件工程的质量管理方式。

原文链接
🛠️ 蛋定 Todo 鸿蒙版

开发者自荐的鸿蒙版 Todo 应用,适合 HarmonyOS 用户尝试轻量任务管理。

https://meta.appinn.net/t/topic/87109 ↗

打开小众软件发现频道帖子,查看作者提供的安装包、应用市场入口或测试说明;如果帖子里有 APK/HAP 或应用商店链接,按说明在鸿蒙设备上安装。上手时可以建立三个清单:今天必做、长期项目、临时想法,测试添加、提醒、完成、归档等基本操作是否顺手。由于是开发者自荐项目,建议同时关注评论区反馈,看看是否有权限、同步、提醒后台保活等移动端常见问题。

鸿蒙生态里的独立开发应用仍在增长,Todo 是最容易体现系统通知、桌面组件、跨设备同步能力的品类。对关注国产移动生态或想做鸿蒙应用的人,它也是观察产品细节的样本。

原文链接
📡 OpenAI Codex Record & Replay

OpenAI Codex 上线 Record & Replay,用户在 Mac 上演示一次重复流程,Codex 可生成可复用 Skill 并在下次用新参数重放。

这相当于把 RPA、Computer Use 和 Skill 生成结合起来。过去让 Agent 学会一个流程,需要人工写步骤、截图、边界条件和验证方式;现在变成“人先做一遍,系统观察并抽象为技能”。目前仅限 macOS、欧盟不可用,且需要开启 Computer Use,说明它仍处在受控发布阶段。

如果这类功能成熟,办公室里的报销、填表、后台配置、内容发布等重复工作会更快被个人自动化,而不是等企业采购大型 RPA。它也会让 Skill 成为 AI 工具生态的核心资产:谁沉淀的工作流多,谁的 Agent 就越像真正的个人助理。

原文链接
📡 Claude Code Artifacts

Anthropic 为 Claude Code 推出 Artifacts,可把 coding session 转成私密、实时更新的网页,便于分享 PR 演示、架构说明、调试过程和发布清单。

Claude Code 原本偏终端协作,Artifacts 把不可见的终端过程变成可浏览、可分享的项目页面。这对团队协作很重要,因为很多 AI 编程成果不是最终代码本身,而是中间的决策、调试路径和风险说明。将这些内容实时网页化,可以降低非开发成员理解 AI 工作流的门槛。

AI 编程工具正在从“个人终端助手”走向“团队协作界面”。未来 PR、设计评审、事故复盘、架构讨论可能都由 Agent 自动生成可交互页面,研发管理和知识沉淀方式会随之变化。

原文链接
📡 Cursor /automate 自动化能力

Cursor 被曝上线 /automate 能力,可用自然语言描述任务,自动配置触发器、指令和工具,形成可运行 automation。

从描述看,Cursor 正在把 IDE 中的 Agent 能力延伸到持续自动化:不是打开编辑器后问一次,而是让任务在 GitHub Issue、Slack 消息等事件触发时自动运行。它和 Codex Record & Replay、Claude Artifacts 构成同一个趋势:AI 编程产品开始争夺“工作流入口”。

开发工具会越来越像自动化平台,IDE、CI、Issue、聊天工具之间的边界被打通。对团队来说,这意味着很多工程流程可以用自然语言搭建;对个人开发者来说,也意味着需要更重视权限、安全和自动执行后的审查机制。

原文链接
📡 Gemini CLI 支持策略变化

有消息称 Google 停止向非企业用户提供开源 Gemini CLI 支持,并引导用户转向专有 Antigravity CLI。

如果属实,这代表大厂 AI 编程工具在开源与商业化之间重新平衡。Gemini CLI 作为开源编程助手曾吸引大量开发者,但当使用成本、产品定位和企业安全要求变重后,厂商可能更倾向把核心能力放进可控的专有工具。

开发者依赖单一厂商 CLI 的风险会增加,企业也会更关注模型和工具链的可替代性。短期内,开源社区可能会寻找替代 CLI;长期看,多模型、多工具编排层会变得更重要,避免工作流被某个供应商策略变化打断。

原文链接
📡 豆包实时语音模型 3.0 API

豆包实时语音模型 3.0 API 上线,支持全双工、端到端语音进出、可插话和多人聊天中的规则遵循。

端到端实时语音模型的价值在于减少 ASR→LLM→TTS 的链路延迟和误差,让交互更接近真人对话。全双工和可插话尤其重要,因为真实语音场景不是一问一答,而是会打断、补充、等待时机和遵守会话规则。

语音 Agent 的落地场景会继续扩展到客服、陪练、会议助手、车载、智能硬件和多人协作。国内厂商提供 API 后,创业团队能更低成本构建中文实时语音产品,竞争重点会转向延迟、稳定性、情绪表达和安全边界。

原文链接
📡 Prometheus 世界模型实验室融资

Jeff Bezos 宣布成立 Prometheus,一家专注物理世界 AI 的前沿实验室,融资 120 亿美元、估值 410 亿美元。

世界模型正在成为下一阶段 AI 竞赛的关键词,目标从文本和视频生成走向可交互、持久、一致的物理模拟。Bezos 入局意味着资本认为机器人、自动驾驶、工业设计和科学实验等物理场景还存在巨大模型红利。

大规模资金进入会推高世界模型方向的人才和算力竞争,也会加速合成数据、仿真环境和机器人训练平台的发展。对普通开发者而言,短期可直接玩的产品不多,但相关开源工具、数据集和模拟平台可能会快速增多。

原文链接

🎯 值得关注