📡 AI 资讯日报

2026-06-10
🔥 今日主线

Anthropic 放出「带护栏的 Mythos」——Claude Fable 5 正式上线,基准测试几乎全线 SOTA,软件工程/长任务领域领先幅度极大。但仅免费到6月22日,之后只能 API 调用。同日 Google Gemini 3.5 Live 发布实时翻译模型,被完全淹没。工具侧,Kuse Workflow 用自然语言生成自动化工作流、MiMo 推出 1000 token/s 超高速模型。

🛠️ Kami v1.7

把 Markdown 渲染成精美幻灯片的开源工具,支持 HTML/PDF/PPTX 输出

https://github.com/tw93/kami ↗

直接 `git clone` 项目到本地,写 Markdown 即可生成幻灯片。支持图表(Mermaid/ECharts)、支持打印导出、无需额外配置。新增韩语支持,文档网站更锐利。安装后 `npm install && npm run dev` 就能在浏览器里预览,写完直接导出 PDF 或 PPTX 分享。适合需要频繁做技术分享但不想用 PowerPoint/Keynote 的开发者。

Tw93 的开源项目一向质量极高(Star 数万级别),Kami 把「写 Markdown = 做幻灯片」这件事打磨到了极致,渲染效果接近专业设计工具。v1.7 版本在排版、多语言和图表支持上都有显著提升。

原文链接
🛠️ Kuse Workflow

用自然语言描述需求,AI 自动生成稳定可复用的自动化工作流

https://kuse.ai ↗

访问官网注册账号,用大白话描述你想要的工作流(例如「监控谷歌邮箱,收到特定邮件自动分析内容并回复」),Kuse 会给出选项,点选后自动创建。已打通 Google 全家桶、Notion、Slack、GitHub、Jira、Canva、Figma 等大量第三方工具。工作流支持定时执行和事件触发。比 n8n 简单得多,不需要手动拖拽节点。

n8n 级别的能力但零门槛,真正把自动化工作流从「只有工程师能用」拉到了「人人可用」。自然语言生成 + 丰富的应用生态,这是低代码/无代码自动化的下一个形态。

原文链接
🛠️ Cohere North Mini Code

3B 激活参数的 MoE 编码小模型,Apache 2.0 开源,专为 Agentic Coding 打磨

https://huggingface.co/CohereForAI ↗

去 HuggingFace 搜索「North Mini Code」,下载模型权重(约 6GB),用 Ollama 或 vLLM 本地部署。3B active 参数意味着普通笔记本就能跑,在 Artificial Analysis Coding Index 上拿到 33.4 分,和同量级对手打得有来有回。适合嵌入到自己的 Agent 工作流中做代码生成,或者用来做本地代码补全。

30B 总参数但只有 3B 激活的 MoE 架构,效率极高。Apache 2.0 协议意味着可以商用、可以微调、可以随便改。这是目前开源编码小模型里最有诚意的发布之一。

原文链接
🛠️ Zero to Claude Code(中文版)

Wix VP 出品的免费课程,从零基础教你用 Claude Code 构建真正的产品

https://zero2claude.dev ↗

打开网站即可开始学习,已有简体中文版。课程从 Claude Code 安装配置开始,手把手带你构建真实产品,全程免费。已有 300 名中国学生在学习。作者 Itay Shmool 专门用中文官宣,表达了对中文 AI 社区的感谢。不需要任何编程基础。

Claude Code 是目前最强的 Coding Agent 之一,但学习曲线陡峭。这个课程由 Wix 的 VP 亲自制作,从实战出发,不是学院派教程。中文版的推出让国内开发者零障碍上手。

原文链接
🛠️ ShipAny 新版本

Agent-Native 开发框架,专为 AI Coding 设计,三套模板一键部署

https://shipany.ai ↗

ShipAny 发布了三套基础模板:shipany-next(Agent-Native 框架,通过内置 Skills 极速开发)、shipany-vinext(基于 Cloudflare Vinext,一键部署到 Workers,体积是原版 1/7)、以及一个绑定 CF 的版本。适合用 Claude Code/Codex 来驱动开发,内置的 Skills 让 Agent 理解项目结构更快。

idoubi 是 ShipAny 作者,这个框架精准抓住了「AI 写代码」时代的新需求——代码结构要对 Agent 友好。模板化 + Skills 内置的设计让 AI 编码效率翻倍。

原文链接
🛠️ Memento-Skills

自我进化的 Agent 框架,Agent 从失败中学习并自动重写自己的 Skills

https://github.com/Sumanth077/memento-skills(搜索此项目名) ↗

克隆仓库后,配置你的 LLM API key,启动 Agent 并给它一个任务。当 Agent 执行失败时,Memento-Skills 不会简单地报错退出——它会分析失败原因,自动修改对应的 Skill 文件,然后重新尝试。这解决了当前大多数 Agent 框架的痛点:Skills 是静态的,写一次就不管了,失败后需要人工调试。

这个设计思路非常前沿——让 Agent 具备「从错误中学习」的能力,而不是每次都重新发明轮子。如果这个模式成熟,Agent 的可靠性将大幅提升。

原文链接
🛠️ MiMo V2.5 Pro UltraSpeed

全球首个 1000+ token/s 的万亿参数模型,输出速度炸裂

https://mimo.app ↗

访问 MiMo 官网或 App,选择 V2.5 Pro UltraSpeed 模型即可体验。归藏实测跑了复杂 3D 场景生成、长文写作等任务,速度体感提升极其明显。1T 参数模型达到这个速度,意味着复杂推理任务不再需要等几十秒——几乎实时出结果。

1000 token/s 是一个里程碑。之前这个速度只存在于小模型,1T 参数级别能达到这个吞吐量,说明推理优化有了质的突破。对于需要实时交互的 Agent 场景意义重大。

原文链接
🛠️ Skills For Real Engineers - Teach Skill

GitHub 122K Star 的 Skills 仓库推出新 Skill,把终端目录变成有状态学习空间

https://github.com/mattpocock/skills/tree/main/skills/productivity/teach ↗

安装该 Skill 后,在任意项目目录下激活 Teach 模式,AI 会把当前目录当作「教材」,根据目录中的代码、文档等内容生成交互式学习体验。设计理念是 Knowledge → Skills → Wisdom,适合用来快速理解一个陌生项目的代码结构和设计思路,或者用来教别人理解你的代码库。

mattpocock 是 TypeScript 圈的顶级内容创作者,他的 Skills 仓库是 Claude Code/Codex 生态里最受欢迎的资源之一。Teach Skill 把「理解代码」从被动阅读变成了主动教学,这个方向非常有想象力。

原文链接
🛠️ 瑞幸咖啡 CLI/Skills/MCP

瑞幸咖啡居然开源了 CLI 工具、Skills 和 MCP 服务,程序员可以用命令行下单

https://open.lkcoffee.com ↗

访问 open.lkcoffee.com 查看安装方式,安装 CLI 后可以在终端里直接下单买咖啡。更骚的是它提供了 MCP 服务,意味着你可以在 Claude Code/Codex 里通过 MCP 工具调用直接下单。还可以绑定支付方式实现「AI 自动帮你买咖啡」。

这可能是国内第一个把 CLI/Skills/MCP 全部开放的大众消费品牌。虽然看起来是营销噱头,但技术栈非常完整,说明瑞幸的技术团队是认真在做开发者生态。这个模式如果跑通,会有更多品牌跟进。

原文链接
📡 Claude Fable 5 & Mythos 5 正式发布

Anthropic 同日发布两个模型——Fable 5(带安全护栏,面向所有用户)和 Mythos 5(去部分限制,仅供 Project Glasswing 网络安全合作伙伴)。两者共享同一底座。Fable 5 基准测试全线 SOTA,软件工程/知识工作/科研/视觉领域领先幅度极大。Andrej Karpathy 称这是「自 Claude 4.5 以来最重大的进步」。

Anthropic 的策略很清晰——把最强模型做安全处理后给大众用(Fable 5),原始版本只给安全合作伙伴用(Mythos 5)。但 Fable 5 的定价是 Opus 的 3 倍、速度是 Opus 的 10 倍,且 6 月 22 日后订阅用户也无法直接使用,只能走 API。这实质上是一次「实力展示 + API 推广」,同时为 Project Glasswing(AI 驱动的网络安全)铺路。Cloudflare 已作为零号客户运行 Mythos 5。

Anthropic 形成了完整产品线(Haiku → Sonnet → Opus → Fable → Mythos),且 Fable/Mythos 在编码和长任务领域拉开了与竞品的差距。但高定价和限时免费策略也让普通用户感到不安。对 OpenAI 和 Google 构成直接压力。

原文链接
📡 Google Gemini 3.5 Live 实时翻译模型发布

Google 发布 Gemini 3.5 Live,主打实时翻译能力,同时 Gemini 模型已通过 Apple Foundation Models 框架在 Xcode 中原生支持。

发布时机极其不幸——刚发完就被 Fable 5 刷屏淹没。但 Gemini 3.5 Live 的实时翻译能力本身是强需求,且集成到 Apple 生态意味着所有 iOS/macOS 开发者都能直接调用。Google 正在从「和 OpenAI 卷 benchmark」转向「嵌入生态」,这个策略更务实。

Google 在消费者 AI 心智上持续落后,但开发者生态渗透在悄悄推进。Apple + Gemini 的组合可能在下半年产生实际产品。

原文链接
📡 WWDC 2026:iPhone Fold 折叠屏抢先体验

WWDC 2026 没有重大发布,但 iOS 27 的 Mac iPhone 镜像模式支持调整窗口大小,被解读为 iPhone Fold 折叠屏的提前适配。国内媒体已展示过折叠屏效果的音乐播放界面。

苹果用软件更新悄悄为硬件铺路,这是其一贯作风。iPhone Fold 预计售价 1.5 万+起步,通过镜像模式让开发者和用户提前适应折叠屏交互,是聪明的过渡策略。

折叠屏 iPhone 可能成为苹果下一个增长点,iOS 生态将迎来新的交互范式。

原文链接
📡 OpenAI 发布「第三阶段」战略

OpenAI 宣布第三阶段三大目标:构建自动化 AI 研究员、加速经济增长、给地球上每个人一个个人 AI 助手。Sam Altman 强调「强大系统必须保持安全、对齐人类意图」。

这是 OpenAI 首次系统性地阐述 AGI 路线图的第三阶段。自动化 AI 研究员意味着让 AI 自主做科研,这是通往 AGI 的关键一步。但「给每个人一个个人 AI」这个目标需要极低的推理成本,目前看还需要时间。

OpenAI 的战略叙事从「模型能力」转向「社会影响」,为其政策和资源争取做铺垫。

原文链接

🎯 值得关注