📡 AI 资讯日报

🛠️ DiffusionGemma — Google 开源扩散文本生成模型

一句话

Google 发布全新扩散式文本生成模型，不用自回归逐个吐字，而是整块起草、纠错、精炼，速度飙到 1000+ token/s。

链接

https://huggingface.co/google/diffusiongemma-2b-v0.1 ↗

怎么玩

从 HuggingFace 直接下载模型权重，支持本地部署推理。基于 Apache 2.0 协议完全开源，你可以用 transformers 库加载，或者通过 Google AI Studio 的 API 体验。与传统自回归模型不同，DiffusionGemma 先用噪声初始化，然后并行去噪生成整段文本，推理速度是同等规模自回归模型的 4 倍。目前开源的是 2B 参数版本，单卡即可跑。对于需要高吞吐的文本生成场景（批量翻译、摘要、数据合成），体验完全不一样。

为什么值得关注

这是 Google 首款生产级扩散文本模型，打破了「大语言模型必须是自回归」的惯性思维。扩散生成天然支持并行解码和非自回归生成，在处理长文本时延迟远低于自回归模型。Apache 2.0 意味着你可以随意商用、修改、蒸馏，没有 Anthropic 那种「不许研究 AI」的 AUP 限制。

应用场景

批量文本生成与数据合成，吞吐量提升 4 倍
嵌入本地应用做实时文本补全，延迟极低

原文链接

@berryxia 查看原文 ↗

🛠️ Cohere North Mini Code — 开源 MoE 编程模型

一句话

Cohere 发布首个开源代码模型，30B 总参数仅激活 3B，面向 Agent 编程场景，256K 上下文。

链接

https://huggingface.co/CohereLabs/North-Mini-Code-1.0 ↗

怎么玩

通过 HuggingFace 下载模型，最低仅需 1×H100（FP8）即可运行。使用标准的 transformers + vLLM 推理。128 个专家中每 token 激活 8 个，意味着推理成本极低。支持 256K 输入和 64K 输出，适合做长代码文件重构和大规模 Agent 任务规划。可以直接挂到 Claude Code、Continue、Aider 等编程助手里当后端模型。官方还提供了详细的微调指南，可以针对自己的代码库做领域适配。

为什么值得关注

Cohere 的 MoE 架构在「参数效率」这个维度上做到极致——30B 的容量、3B 的推理成本，这个比例目前是最优之一。专门为 Agent 编程优化（不是补全，是自主完成任务），256K 上下文意味着可以吞下整个 repo。在开源编程模型中，它是参数效率最高的选择之一。

应用场景

接入本地 AI 编程助手作为后端推理引擎
长代码文件级别重构和跨文件 Agent 任务

原文链接

@shao__meng 查看原文 ↗

🛠️ Gemini 3.5 Live Translate — Google 实时同传翻译

一句话

Google 发布实时翻译模型，70+ 语言边听边译，保留说话人语调节奏，延迟仅几秒。

链接

https://translate.fishjam.io ↗

https://ai.google.dev/gemini-api/docs/live-api/live-translate ↗

怎么玩

直接访问 translate.fishjam.io 即可在线体验，选好源语言和目标语言，对着麦克风说话，几秒后就能听到翻译结果。Google Translate App 也新增了「听筒模式」，贴耳即听翻译。开发者可以通过 Gemini Live API 接入，支持流式音频输入/输出，自动滤除背景噪音，嘈杂环境也能稳定工作。目前已支持 70+ 语言对，中文↔英文实测效果流畅自然。

为什么值得关注

这不是传统的 ASR→翻译→TTS 串行流水线，而是端到端实时翻译模型，直接从音频到音频。保留了说话人的语调、节奏和音高（voice preservation），比传统方案更像「同传译员」而非「机器人朗读」。API 开放后，任何视频会议、播客、在线教育平台都可以接入实时多语言能力。

应用场景

跨国视频会议实时同传，无需等待发言结束
海外视频/播客实时翻译收听

原文链接

@xiaohu 查看原文 ↗

🛠️ Text-To-Lottie Agent Skill — 让 AI 生成 Lottie 动画

一句话

一套 Agent Skill + 本地预览工具，让 Claude Code/Codex/Cursor 等 Agent 直接生成 Lottie 动画并在浏览器实时验收。

链接

https://github.com/diffusionstudio/lottie ↗

怎么玩

一行命令安装：`npx skills add diffusionstudio/lottie`。安装后，在 Claude Code 或 Codex 中直接说「生成一个加载动画的 Lottie」，Agent 就会调用 Skill 生成对应的 Lottie JSON 并自动打开本地浏览器预览。Skill 内部教会了 Agent Skottie（Lottie 的底层格式）语法，支持关键帧、路径动画、形状变换等常用动画原语。预览 harness 是一个本地 Web 服务，实时渲染 Lottie，所见即所得，不满意可以继续对话微调。

为什么值得关注

Lottie 动画在 App/Web 中无处不在，但手写 Lottie JSON 极其痛苦（坐标计算、贝塞尔曲线）。这个 Skill 把「意图→动画文件」的链路打通了，Agent 直接输出可用的 .json 文件而不是一段描述。对独立开发者和设计师来说，省掉了 AE 导出 Lottie 的繁琐流程。

应用场景

快速生成 App 中的加载动画、图标动效
产品原型中嵌入交互动画，所见即所得迭代

原文链接

@shao__meng 查看原文 ↗

🛠️ 橙线插画 Skill — 开源 AI 插画配图工具

一句话

Orange AI 将文章配图流程蒸馏成开源 Skill，一键为文章生成统一风格的插画。

链接

https://github.com/orange2ai/orange-line-illustration ↗

怎么玩

安装 Skill 后，在 Claude Code 或支持 Skills 的 Agent 中使用。给定一段文本，Skill 自动分析内容、提取关键场景、生成线稿风格插画配图。风格统一为「橙线」——线条简洁、色彩克制的扁平化插画风格。适合博客、公众号、Newsletter 写作者快速配图，不需要打开 Figma 或找设计师。Skill 内部串联了多步 prompt chain：内容分析→构图规划→风格化生成→后处理，一步到位输出可直接使用的 PNG。

为什么值得关注

这是一个「把个人工作流蒸馏成可复用 Skill」的绝佳范例。作者把自己给文章配图的完整思考链（分析内容→选场景→定构图→执行风格）编码进了 Skill，别人装上就能用，不需要理解背后的 prompt engineering。开源 Skill 生态正在崛起，这种可组合的 Agent 能力模块会成为新的「软件包」。

应用场景

公众号/博客写作者批量配图，风格统一
产品文档、教程中的插图自动化生成

原文链接

@oran_ge 查看原文 ↗

🛠️ 书籍解读口播脚本 Skill — 多 Agent 协作写稿

一句话

开源 Skill，调用多个 Subagent 从不同角度写书评脚本，主 LLM 整合成终稿。

链接

https://github.com/joeseesun/qiaomu-book-script ↗

怎么玩

安装指令 `npx skills add joeseesun/qiaomu-book-script`。安装后只需说「解读《被讨厌的勇气》」，Skill 会自动启动多个 Subagent：一个负责提炼核心观点，一个分析写作背景，一个挖掘金句，一个写读后感——四个 Agent 并行工作，最后由主 LLM 统稿润色，输出结构完整的口播脚本。特别适合做读书分享视频/播客的创作者，把原本 2 小时的构思压缩到几分钟。

为什么值得关注

这是目前开源 Skill 生态中「多 Agent 协作」范式的典型代表——不是让一个模型硬写，而是分工协作、并行产出、最后统稿。这种 Subagent 模式在复杂写作任务上的质量远超单次对话，而且工程实现很轻量。对 Skill 开发者来说，这个仓库是学习「如何编排 Subagent」的好教材。

应用场景

短视频/播客读书分享脚本批量生产
学习 Subagent 编排模式，迁移到自己的写作 Skill

原文链接

@vista8 查看原文 ↗

🛠️ 讯飞星火限免 Qwen3.6 模型

一句话

讯飞开放平台限免 Qwen3.6 系列模型 API，支持 Claude Code 和 OpenClaw 接入，承诺高并发不限量，截止 6 月 30 日。

链接

https://xinghuo.xfyun.cn ↗

怎么玩

注册讯飞开放平台账号，在模型广场找到 Qwen3.6 系列，领取免费额度。API 兼容 OpenAI 格式，直接填到 Claude Code 的 API 配置里（provider 选 openai-compatible，base_url 填讯飞端点）就能当编程助手的后端模型。也支持 OpenClaw、ChatBox 等第三方客户端。Qwen3.6 是阿里最新开源模型，代码和推理能力对标 GPT-4 级别，讯飞这次不限并发，实测响应速度很快。趁 6 月底前白嫖，性价比拉满。

为什么值得关注

Qwen3.6 在编程和推理 benchmark 上接近 Claude Opus 级别，但完全免费不限量（对比 Fable 5 一问 0.5 美元）。对于日常编码、文档处理、翻译等中高频场景，找一个便宜好用的模型比追最新旗舰更实际。讯飞这次活动是体验国产模型能力的低成本入口。

应用场景

替代高价 API 做日常编程辅助，零成本
接入 OpenClaw 等工具做批量文本处理

原文链接

@appinn 查看原文 ↗

🛠️ Zero to Claude Code — Wix VP 免费中文课程

一句话

Wix VP 推出的免费 Claude Code 入门课程，已支持简体中文，从零教你用 AI Agent 编程。

链接

http://zero2claude.dev ↗

怎么玩

打开 zero2claude.dev 网站，选择中文语言，从第一章开始按顺序学习。课程覆盖：Claude Code 安装配置、基本命令、Skills 使用、多 Agent 协作、实际项目案例（构建全栈应用）。每章有配套练习和 prompt 模板。作者用中文官宣并感谢了中文 AI 社区，翻译质量不错。全程免费，不需要任何前置知识，适合新手从「听说过」到「真正上手干活」。

为什么值得关注

目前中文 AI 编程教育领域缺少系统性课程，大部分是零散的推文和视频。这个课程由真正在 AI 编程一线的人（Wix 的 VP）编写，案例来自真实工作流，不是纸上谈兵。免费 + 中文 + 系统化，对中文开发者来说是稀缺资源。

应用场景

从零开始学习用 Claude Code 做全栈开发
作为团队 AI 编程培训的内部教材

原文链接

@shao__meng 查看原文 ↗

🛠️ CodePilot v0.56.0 — 开源 AI 编程桌面端更新

一句话

开源 AI 编程 GUI 工具更新，新增 Claude Fable 5 和 MiMo UltraSpeed 支持，修复多项问题。

链接

https://github.com/op7418/CodePilot/releases/tag/v0.56.0 ↗

怎么玩

从 GitHub Releases 下载对应平台的安装包（macOS/Windows/Linux），安装后配置 API Key 即可使用。新版支持 Claude Fable 5（Anthropic 最新旗舰）、小米 MiMo UltraSpeed、以及通用 OpenAI 兼容第三方渠道。GUI 界面下可以切换模型、管理对话、查看用量统计。还修复了回复状态丢失、服务商列表刷新等细节问题。适合不想用命令行的开发者——有完整的聊天界面、文件管理、代码高亮这些 IDE 级别的体验。

为什么值得关注

CodePilot 是目前中文开源社区最活跃的 AI 编程桌面端之一，更新快、渠道多。v0.56.0 是 Fable 5 发布后首批跟进的客户端，而且部分修复就是用 Fable 5 自己写的（dogfooding）。开源 MIT 协议，可以自己改 UI 加功能。

应用场景

团队统一 AI 编程工具，支持多模型切换
不想用命令行的同学用 GUI 体验 Fable 5

原文链接

@op7418 查看原文 ↗

📡 Anthropic 秘密提交 S-1 准备 IPO

事件

PitchBook 发布 Q2 2026 Anthropic 专题报告，披露 Anthropic 已于 6 月 1 日秘密提交 S-1，估值或达 $965B，$47B ARR，成为首个正式启动 IPO 的前沿 AI 实验室。OpenAI 在一周后跟进提交。

解读

这是 AI 行业真正的「锚点时刻」。如果 Anthropic 以这个估值上市，它将不仅定义 AI 公司的定价基准，还会重新校准整个科技行业的估值体系。$47B ARR 意味着它的年化收入已经超过大多数 SaaS 巨头。值得注意的是，S-1 是秘密提交的——在正式路演前，市场只能靠 PitchBook 这类机构的分析推测真实财务状况。中文媒体几乎未报道这个时间节点和估值细节，存在显著信息差。

影响评估

一旦上市，Anthropic 将面临季度财报压力，可能会加速商业化（提高 API 价格、收紧免费额度）。同时 IPO 会释放大量流动性，吸引更多资本涌入 AI 赛道，加速第二梯队（Cohere、Mistral 等）的融资节奏。对用户来说，短期内 API 价格可能继续上涨。

原文链接

@seclink 查看原文 ↗

📡 Fable 5 限制 AI 研究方向引发社区反弹

事件

Anthropic 在 Fable 5 的 AUP（可接受使用政策）中加入限制条款：「任何与构建预训练管道、分布式训练基础设施或 ML 加速器设计相关的主题……可能受到限制」。HuggingFace CEO Clement Delangue、alphaXiv、antirez 等多位行业人物公开批评，Yann LeCun 大量转发。

解读

这不是普通的「安全审查」，而是从根本上限制了用户研究 AI 本身的自由。如果你在用 Fable 5 研究如何训练更好的模型、优化分布式训练、甚至讨论 ML 硬件，都可能被过滤。对于学术研究者和开源社区来说，这等于 Anthropic 在说「只有我们能做 AI 研究，你们不行」。Clement 的批评一针见血：权力集中、能力集中、经济财富集中才是 AI 最大的风险。

影响评估

这次争议可能会加速开源模型的采用——与其被 AUP 限制，不如用 DiffusionGemma、Qwen、Llama 等 Apache 2.0 模型。Anthropic 在开发者社区的口碑正在分化：企业客户爱它的代码能力，研究者恨它的审查制度。长期看，过于激进的 AUP 会倒逼生态分裂。

原文链接

@askalphaxiv 查看原文 ↗

📡 WWDC 2026：LM Studio 聚类功能登上 Steve Jobs Theater

事件

WWDC 2026 上，yagilb 在 Steve Jobs Theater 现场演示 LM Studio 即将推出的聚类功能，基于苹果 MLX 团队的工作。Apple 也使用 OpenCode 演示了 MLX。

解读

苹果在 AI 上的策略越来越清晰：不做通用大模型，而是打造最好的本地推理基础设施。MLX（Apple Silicon 上的机器学习框架）已经成为 Mac 生态中运行开源模型的事实标准。LM Studio 的聚类功能意味着多台 Mac 可以组成一个推理集群——这对小型团队来说是极具吸引力的方案。

影响评估

Mac 正在成为 AI 开发者的标配机器。MLX 生态的成熟会让更多模型优先适配 Apple Silicon，形成正向循环。WWDC 舞台上演示第三方 AI 工具（而非自家模型），说明苹果在 AI 上走的是「平台赋能」路线而非「自己造轮子」。

原文链接

@yagilb 查看原文 ↗

📡 Microsoft MAI-Thinking-1 论文公开完整训练细节

事件

微软发布 MAI-Thinking-1 论文，罕见公开了训练前沿模型所需的所有信息——包括 30 万亿 token 预训练数据量、3.55 万亿 token 中期训练（STEM/数学/代码）、以及 RL 阶段的详细超参数。被 Yann LeCun 转发并称赞。

解读

在闭源趋势愈演愈烈（Fable 5 连研究用途都限制）的当下，微软这篇论文是开放科学的一面旗帜。30T token 的预训练规模表明微软在基础设施投入上不输任何玩家。公开超参数意味着任何有足够算力的团队都可以复现或改进——这对于学术界尤其是宝贵资源。

影响评估

这篇论文可能会成为未来几个月开源模型训练的标准参考，类似当年的 Llama 论文效应。微软在「开放研究」和「商业化」之间的平衡值得观察。

原文链接

@natashajaques 查看原文 ↗ @HiTw93 查看原文 ↗ @xicilion 查看原文 ↗ @appinn 查看原文 ↗ @appinn 查看原文 ↗ @appinn 查看原文 ↗ @seclink 查看原文 ↗ @vista8 查看原文 ↗ @appinn 查看原文 ↗ @appinn 查看原文 ↗ @tuturetom 查看原文 ↗ @appinn 查看原文 ↗ @appinn 查看原文 ↗ @berryxia 查看原文 ↗

🎯 值得关注

Mole 开源项目被「抄袭」争议：Tw93 的 MIT 开源 CLI 工具被他人包装成「付费版免费替代」，作者考虑闭源 →
docu.md 支持批注功能：响马的在线文档工具新增批注能力 →
MP工具箱：截图/剪贴板/录动图/取色器/中英文绑定/置顶窗口等多合一 Windows 工具 →
FusionCloud 网盘挂载工具：把天翼/百度/夸克网盘和对象存储挂成本地磁盘，免费公测 →
Document to Markdown：一键将 PDF/Docx/PPT 转纯净 Markdown，为 AI 喂料瘦身 →
Coze CLI：字节的 Coze 命令行工具，产品体验不错 →
产品经理 Skill 5天 13k Stars：涵盖产品经理日常工作流的大而全 Skill 包 →
全球机票酒店查询 Skill：by RollingGo，Agent 内直接搜机票酒店 →
PowerToys v0.100.0：全新快捷键指南/命令面板扩展库 →
Claude Fable 5 情报站：Tom Huang 用 Fable 5 生成的可交互信息聚合站 →
压缩包文件清理工具：删除解压后散落文件的单 exe 小工具 →
Windows 11 Low Latency Profile：正式上线，明显加速系统响应 →
小米 MiMo-Code 开源：终端原生 AI 编程助手，跨会话永久记忆，自主子代理 →