📡 AI 资讯日报

2026-06-18
🔥 今日主线

今天最值得动手的是 Agent 工具链继续向「可配置、可切换、可落地」推进:从 Coding Agent 模型切换、托管式研究 API,到可视化 Agent Dashboard 和本地 OCR 工作台,都更偏向马上试用。另一个明显方向是开源/国产模型与设计工具加速融合,GLM-5.2、Open Design、Grok Imagine 这类能力正在变成可接入的生产组件。

🛠️ CC Switch

一个开源工具,用来在 Coding Agent 里快速切换不同模型,适合同时使用 Claude、Codex、开源模型或自定义模型端点的开发者。

https://github.com/farion1231/cc-switch ↗

先打开 GitHub 仓库查看 README,按项目说明安装 CLI 或配置脚本;安装后把你常用的 Coding Agent 客户端、模型供应商 Key、本地或远端模型端点写进配置文件。实际体验时,可以用同一个代码修复任务分别切到默认模型、便宜模型和本地模型跑一遍,观察响应速度、代码质量、工具调用稳定性和成本差异。最适合把它接到日常开发流里:比如简单重构走低成本模型,复杂架构问题再切到强模型。

Coding Agent 正在从「绑定单一模型」走向「可插拔模型路由」。CC Switch 的价值不是多一个包装 CLI,而是把模型选择权还给开发者,让同一个 Agent 工作流可以根据任务难度、预算、延迟和隐私要求灵活切换,尤其适合正在尝试开源模型替代闭源模型的团队。

原文链接
🛠️ Exa Agent

Exa 发布的托管式 Web Research Agent API,把搜索、任务拆解、并行子 Agent 和结果整理封装成一个接口。

https://exa.ai/blog/exa-agent ↗

进入 Exa 官方博客阅读接口说明,然后注册 Exa 账号并申请 API Key。上手可以先选一个明确任务,例如「找出最近三个月融资的 AI Infra 公司并整理官网、创始人、融资轮次」,用 Exa Agent API 发起研究请求,再把返回结果与普通搜索结果对比。进一步可以把它接进自己的 CRM、投研表格或自动日报脚本里,让它定期补全公司资料、竞品动态和实体信息。

传统搜索 API 返回的是网页列表,真正可用的研究还需要人或 Agent 做分解、筛选、交叉验证和结构化。Exa Agent 把这一层直接产品化,对做市场研究、名单构建、销售线索 enrichment、行业情报监控的人非常实用,也说明搜索引擎正在变成 Agent 基础设施。

原文链接
🛠️ docu.md

一个面向 Markdown / GitHub 文档的在线阅读器,现在支持直接显示 GitHub 内嵌图表。

https://docu.md ↗

直接访问 docu.md,把你想阅读的 GitHub README、技术文档或 Markdown 项目地址贴进去,观察它如何重新排版文档内容。今天的新点是 GitHub 里的内嵌图表能直接显示,适合找一个包含 Mermaid、架构图或流程图的开源项目试试。可以把常看的长 README、设计文档、接口说明加入书签,用它替代 GitHub 默认阅读页面,尤其适合在手机或平板上阅读复杂技术文档。

开源项目越来越依赖 Markdown 承载产品说明、系统架构和流程图,但 GitHub 原生阅读体验并不总是适合深度阅读。docu.md 这类工具把 Markdown 文档变成更顺滑的阅读入口,支持图表后,对读架构文档、模型说明和 Agent 项目 SOP 的体验提升明显。

原文链接
🛠️ FastClaw Cloud

一个不用写代码即可在 Dashboard 创建 Agent 的平台,可配置 models、skills、files,并自带 Sandbox 做工具调用。

http://cloud.fastclaw.ai ↗

打开 cloud.fastclaw.ai 注册或登录后,新建一个 Agent。先选择模型,再配置 Agent 的身份、启动说明、可用 Skills 和文件;接着在平台自带 Sandbox 里调试工具调用,测试它是否能读取上下文、执行任务并返回稳定结果。跑通后,可以通过 API 把这个 Agent 接到自己的客户端、网页产品或内部系统里。建议从一个低风险任务开始,例如自动整理网页资料、生成客服草稿或处理固定格式文档。

很多人想做 Agent,但卡在环境、工具、模型和记忆配置上。FastClaw Cloud 把这些基础设施做成可视化配置,降低了从想法到可调用 Agent 的门槛;如果 API 和 Sandbox 稳定,它更像是 Agent 应用的后端控制台,而不是单纯聊天机器人。

原文链接
🛠️ Open Design 0.10.0

开源 AI 设计工作台,把点选、评论、标注、编辑、截图灵感和 AI remix 放进同一个设计循环。

https://opendesign.dev ↗

访问 Open Design 官网或项目入口,按说明在本地或在线环境启动工作台。上手可以准备一张产品截图、一个网页灵感图或一句界面需求,让 AI 生成初稿;随后用点选和标注指出需要改的局部,例如按钮层级、卡片布局、配色或文案,再让 AI remix。推荐把它放到 Cursor 或常用 Coding Agent 旁边试用:先生成设计,再把结果交给 Agent 实现,最后继续截图回 Open Design 做迭代。

AI 编程工具正在补上设计闭环,Open Design 的重点不是一次性生成 UI,而是把人类审美反馈、局部修改和 Agent 执行连接起来。它支持多个 AI Agent,也能直接跑在开发环境里,对独立开发者和小团队尤其有价值。

原文链接
🛠️ PP-OCRv6 Mac 本地工作台

一个免费开源的本地 OCR 工作台,把 PP-OCRv6 做成 Mac App,并用 CoreML 加速 Tiny、Small、Medium 三种模型。

https://t.co/Kn7jg3TEek ↗

从原文提供的开源地址进入仓库,下载 Release 里的 Mac 版本,或按 README 从源码构建。第一次打开后,先选择 Tiny 模型测试截图、票据、PDF 截图等轻量文本识别;如果对准确率要求更高,再切换 Small 或 Medium。建议用中英文混排、表格截图、低清图片各测一轮,比较速度、识别率和本地资源占用。因为它本地运行,适合处理不方便上传云端的敏感图片。

OCR 是很多自动化流程的基础能力,但在线 OCR 涉及隐私和成本。本地化 PP-OCRv6 加 CoreML 的组合,兼顾轻量、速度和离线可用性,对 Mac 用户很友好,也能成为文档处理、票据归档、截图转文本工作流里的基础组件。

原文链接
🛠️ seo-audit-skill

一个面向 Agent 的深度 SEO 技术审计 Skill,新增站点 URL 盘点、测试环境收录风险、PageSpeed、Schema 和多语言 SEO 检查。

https://github.com/JeffLi1993/seo-audit-skill ↗

打开 GitHub 仓库,把 Skill 按 README 安装到你使用的 Agent 环境里,例如 Claude Code、Codex 或兼容 Skills 的本地 Agent。准备一个网站域名,先让 Skill 读取 Sitemap 做 URL Inventory,再选择几个代表页面做 Lighthouse、Schema、Canonical、多语言 hreflang 和索引风险检查。最好先跑自己的博客或小型官网,确认输出结构和建议质量,再用于客户网站或生产项目。

SEO 审计很适合 Agent 化,因为它既有固定清单,又需要根据站点结构做判断。这个 Skill 把 URL 资产盘点、技术风险发现和页面级审计串起来,能减少人工遗漏,也适合增长、独立站和内容团队把 SEO 检查标准化。

原文链接
🛠️ WinCal

Windows 任务栏日历工具,可显示日程,并支持 ics 日历订阅。

https://appinn.com/wincal/ ↗

进入小众软件文章页面,按文中链接下载 WinCal 并安装到 Windows。启动后把它固定到任务栏或托盘区域,然后导入或订阅你的 ics 日历,例如 Google Calendar、公司日历、课程表或公开节假日订阅。设置好后,点击任务栏即可快速查看近期日程,不需要打开完整日历应用。建议先用一个只读的公开 ics 链接测试订阅,再逐步接入个人日历。

Windows 原生日历和任务栏日程体验一直偏弱,很多人只是想在桌面快速看到今天和本周安排。WinCal 属于小而实用的效率工具,支持 ics 后可以把多来源日程聚合到任务栏,适合重度桌面办公用户。

原文链接
🛠️ Grok Imagine Video 1.5

Grok 里的视频生成模型更新,支持多国语言和中文,已可直接生成视频内容。

https://grok.com/imagine/post/01267701-7195-472e-b717-1f1e2d66dae9 ↗

打开 Grok 的 Imagine 入口或原文中的示例链接,使用支持该功能的账号进入视频生成界面。先用短提示词生成一个 5 到 10 秒的视频,例如产品宣传片开场、角色说中文、自媒体口播封面动画;再逐步增加镜头、风格、语言和动作要求。建议与 Seedance、即梦或其他视频模型用同一提示词对比,重点看中文口型、运动稳定性、画面一致性和生成速度。

Grok 正在把图像/视频生成能力补齐到通用 AI 产品里,Video 1.5 虽然未必领先 Seedance,但胜在入口集中、社交传播链路短。如果多语言与中文表现稳定,它会成为快速做短视频草稿、创意验证和社交内容试验的新选择。

原文链接
🛠️ Claude Code History Viewer

一个用于查看 Claude Code 历史聊天记录的 viewer,解决回看旧会话不方便的问题。

https://t.co/H4EJ9bSzGU ↗

从原文链接进入项目页面,按 README 安装或启动 viewer。使用前先找到本机 Claude Code 保存会话记录的位置,按工具要求授权读取或导入历史文件。第一次建议只导入一个非敏感项目的会话,确认它能按时间、项目或关键词展示记录;之后再用于查找过去的调试思路、命令、上下文和模型输出。若涉及公司代码,先确认 viewer 是否本地运行以及是否会上传数据。

Agent 编程的历史会话其实是高价值资产,里面有需求推理、错误排查、命令记录和设计决策。能结构化浏览历史记录,就相当于给 Coding Agent 增加了可回溯记忆,对复盘、继续旧任务和沉淀团队知识都有帮助。

原文链接
📡 GLM-5.2 正式发布并开源权重

智谱/Z.ai 发布 GLM-5.2,主打编码和 Agent 任务,支持 1M 上下文、思考力度控制,并开放 MIT 许可权重。

这次 GLM-5.2 的讨论热度很高,核心不是单个榜单名次,而是它把长上下文、Agent 长周期任务和代码能力同时作为主卖点。百万上下文加 IndexShare 这类稀疏注意力优化,意味着它试图在真实工程任务中降低长输入成本;MIT 权重许可也让开发者可以下载、量化、蒸馏、微调和本地部署。

如果 GLM-5.2 在真实 Coding Agent 场景里稳定接近闭源强模型,会进一步压缩闭源模型在开发者工具链里的护城河。对国内 Agent 产品、IDE 插件、私有化部署和企业知识库来说,这类高性能开源权重会成为重要替代选项。

原文链接
📡 OpenAI Codex 支持接入开源模型

多位博主提到 Codex 的 App、CLI 和 SDK 支持开发者把底层模型替换成开源模型或其他模型。

这说明 Coding Agent 的竞争重点正在从单一模型能力,转向客户端、工具调用、上下文工程和模型路由。Codex 如果允许接入任意模型,就会从「OpenAI 模型入口」变成更通用的 Agent 执行环境,开发者可以在同一套交互和工具协议上比较不同模型。

这会推动模型供应商围绕 OpenAI 兼容接口、Agent 工具调用稳定性和成本展开竞争。对用户来说,未来可能不再纠结用哪个 Agent 客户端,而是把客户端当作壳,根据任务切换模型。

原文链接
📡 Framer 上线 Agent 能力

网页构建工具 Framer 开始加入 Agent 能力,尝试把 AI 与其现有建站基础设施结合。

Framer 本来就拥有设计、发布、组件和托管链路,如果 Agent 能理解页面结构并完成局部修改,它会比纯文本生成网页更接近真实生产流程。问题在于 Framer 过去在 AI 迭代速度上偏慢,现在补 Agent 能力既是防守 Cursor、Lovable、v0 等新工具,也是重新利用自身产品深度。

无代码/低代码建站工具会越来越像 AI 产品经理加前端执行器。对设计师和增长团队来说,未来 Landing Page 的创建、文案测试、局部改版和上线可能都在同一个 Agent 化工作台完成。

原文链接
📡 微信推出 AI Agent 专属支付卡

微信被曝为 AI Agent 提供专属支付卡,让用户能在对话里完成推荐、下单和支付。

Agent 商业闭环最难的是支付和履约,微信如果把支付能力开放给 Agent,相当于把对话推荐直接连接到交易系统。它不是简单的聊天机器人功能,而是让 Agent 能参与消费决策、订单生成和支付授权,未来会影响电商、生活服务和本地服务入口。

一旦微信生态内的 Agent 支付跑通,品牌、小程序和服务商会开始围绕「对话内成交」重新设计转化链路。对支付宝、抖音和美团等平台来说,这会加速 Agent 入口和支付能力的竞争。

原文链接

🎯 值得关注