开源模型与工具生态大爆发:Kimi 发布 K2.7-Code 编程模型直追一线,墨韵 1.0 开源国风水墨画应用惊艳上线,Open Design 63.6K 星后再推内建浏览器。可上手的高质量项目密集发布,周末正好逐一把玩。
开源模型与工具生态大爆发:Kimi 发布 K2.7-Code 编程模型直追一线,墨韵 1.0 开源国风水墨画应用惊艳上线,Open Design 63.6K 星后再推内建浏览器。可上手的高质量项目密集发布,周末正好逐一把玩。
Kimi 在 K2.6 基础上专为编程 Agent 定向优化的开源代码模型,长链路编码任务成功率更高、推理 token 更少。
直接访问 HuggingFace 模型页面下载权重,支持 transformers 加载。三项编码基准相比 K2.6 大幅提升:Kimi Code Bench v2 +21.8%(50.9→62.0),Program-aided Reasoning 也有显著进步。可在本地部署后接入 Claude Code/Codex/Hermes 等 Agent 作为底层模型,实测长链路编码任务(多文件重构、全栈功能开发)的成功率和效率。如果显存不够,可先用 4-bit 量化版本在消费级显卡上跑通。
K2.6 已经是国内编码模型的标杆,K2.7 在 Agent 场景下的专项优化直指当前最大痛点——长上下文编码任务中的推理漂移和 token 浪费。+21.8% 的基准提升不是小修小补,说明团队在 RL 训练流程上找到了明确方向,这也是 Kimi 首次在开源模型上认真对标 Claude/GPT 的 Agent 编码能力。
完整的开源中国水墨画创作工具,支持多种笔刷、四种纸张颜色、题词和印章功能,桌面端直接浏览器玩。
打开 inkpainting.tanshilong.com 即可在浏览器中直接作画(推荐桌面端,移动端较吃资源)。可选多种笔刷笔触和颜色浓度搭配使用,纸张有四种不同底色可选。题词功能支持自定义文字,印章功能可落款盖章,仪式感拉满。源码已在 GitHub 完整开源,开发者可 fork 后二开,也可以本地 clone 部署。整套前端无需后端,静态页面即可运行。
市面上 AI 绘画工具扎堆,但真正把中国传统水墨画的笔触质感在浏览器中实现的极少。开源意味着社区可以持续丰富笔刷库和纸张纹理,甚至接入 AI 辅助构图。从技术实现上看,Canvas 渲染水墨扩散效果的工程难度很高,这套代码本身就是很好的前端学习素材。
63.6K GitHub 星的 AI 设计工具新增内建浏览器,一键将网页截图转化为可编辑的设计稿,告别 Figma 多窗口跳转。
从 GitHub 下载最新 0.10.0 版本安装。打开 Open Design 后使用内建浏览器访问任意网页,点击截图按钮即可将当前页面截图自动转化为 OD 设计稿,无需像 Figma Chrome 插件那样在多个窗口间来回跳转。本次更新还内置了覆盖灵感、真实产品 UI、动效、配色、字体、图标和设计系统的全面参考网站库,设计师可直接在设计稿中引用参考素材。45 天冲到 63.6K 星,社区活跃度极高,校园大使和远程志愿者项目也正在招募。
OD 把「网页截图→设计稿」的流程缩短到了一个窗口内,这比 Figma 插件的工作流高效太多。内建浏览器意味着它不再只是设计工具,而是逐渐成为一个「设计浏览器」,结合 AI 能力可以直接分析和重组任何网页的设计元素。45 天 63.6K 星的增速在开源设计工具中极为罕见,说明独立设计师对 Figma 替代品的需求远超预期。
前大厂高管做的出海 AI 创作工具,集收藏、排版、知识管理、AI 生图于一体,经过两年打磨正式发布 1.0。
访问 youmind.com 注册账号。核心功能包括:AI 辅助内容创作和排版、知识收藏与组织、AI 生图(尤其擅长调优 Agent 生图效果)。子木分享了 Skill「blog-to-twitter-post」可直接安装使用——将博客文章一键转为 Twitter 帖子。1.0 发布同步推出种草活动(youmind.com/zh-CN/zhongcao),新用户有订阅福利。社区已有不少用户分享的 PPT 和生图案例可参考。
玉伯(前阿里高管)独立创业两年的作品,在 AI 工具泛滥的当下坚持做到了 1.0 才正式发布,说明产品完成度很高。最独特的差异化在于「AI 生图 Agent 调优」——不是简单地接一个 DALL-E API,而是用 Agent 帮你迭代 prompt 直到出满意结果。这在目前的知识管理工具里几乎没有对手做。
轻量级 macOS 菜单栏工具,为任意应用绑定全局快捷键,一键唤出/隐藏,免费开源。
从 GitHub 下载 MACKey 安装包,拖入 Applications 文件夹启动。菜单栏会出现图标,点击后可添加新的快捷键绑定——选择目标应用(如 VS Code、终端、浏览器),设定组合键(如 Cmd+Shift+J),保存后即可在任何界面一键切换到该应用。支持「如果已打开则聚焦,未打开则启动」的智能逻辑。源码开放,开发者可参考其 Accessibility API 的使用方式。
macOS 原生的快捷键管理非常有限,第三方工具如 Keyboard Maestro 又过于复杂且收费。MACKey 精准切中了「我就想给几个常用 App 绑个快捷键」的最简需求,代码量小、逻辑清晰,是学习 macOS Accessibility API 的优秀范例。对键盘流用户来说,装完就能省掉大量 Cmd+Tab 找应用的碎片时间。
专为 AI Agent 开发场景设计的 PRD 文档生成 Prompt,一行命令安装,让 AI 读懂你要什么后再写代码。
终端执行 `npx skills add joeseesun/qiaomu-ai-prd` 安装到 Codex/Claude Code 等支持 skills 的 Agent 中。使用时会先生成一份结构化的 AI-PRD 文档(包含产品规格 PRODUCT.md 和技术规格),然后再让 Agent 基于这份文档开发。比起直接说「帮我做一个XX」,AI-PRD 把用户故事、功能边界、验收标准都写清楚,Agent 的理解偏差大幅降低。Prompt 原文也在飞书文档中公开,可自行修改适配。
这是「Spec 驱动开发(SDD)」理念在 AI 编程场景下的具体落地。meng shao 等人总结的教训——Agent 出错往往是需求理解偏差——在这个 Skill 里得到了系统性解决。它不是又一个「帮你写代码」的工具,而是从根源上提升人机协作的精准度,符合「先写规格再写代码」的工程常识。
小米开源的中英双语语音识别和合成模型,支持吴语、粤语、闽南语等多种方言,限时免费。
在 HuggingFace 搜索 mimo-v2.5-asr(语音识别)和 mimo-v2.5-tts 系列(语音合成、声音克隆、声音设计)。ASR 模型支持中英混合代码切换和多方言识别,甚至能高精度转写歌词。TTS 系列包含基础合成、声音克隆(voiceclone)和声音设计(voicedesign)三个变体,目前限时免费。可直接通过 HuggingFace 的 Inference API 在线试用,或下载权重本地部署。语音合成效果自然度接近真人,声音克隆只需少量样本即可复刻。
小米在语音 AI 上的积累一直被低估,这次开源的方言支持是非常实用的差异化能力——粤语、闽南语、四川话这些在主流 ASR 模型里几乎找不到支持。加上限时免费的定价策略,说明小米在开源 AI 生态上开始认真发力,这对 OpenAI Whisper 等闭源竞品是实质性的竞争。
余承东在华为开发者大会上宣布盘古大模型全面开源升级为 openPangu 2.0,并放话「字典里没有第二,只有第一」。
华为此举直接对标 Llama 和 Qwen 的开源生态,试图在国产大模型阵营中建立自己的开发者护城河。盘古系列此前主要面向政企客户,全面开源意味着华为意识到闭源路线在开发者生态建设上的劣势。但从余承东的表态看,openPangu 2.0 在基准分数上可能确实有亮眼表现,否则不敢如此高调。值得关注的是华为是否会把昇腾算力与盘古模型做深度绑定,以此推动自家 AI 芯片生态。
国产开源模型竞争从「百模大战」进入「寡头对垒」阶段——千问、Kimi、盘古三家各有算力/应用/政企优势,小厂自研模型的空间进一步收窄。开发者侧利好:开源模型质量持续提高,选择更多、成本更低。
SpaceX 于6月12日上市交易,引发中文 AI 圈对「中国版星链」千帆星座(G60星链)的广泛讨论。
SpaceX 上市是今年科技投资领域最大的单一事件,而千帆星座被拿出来对标,核心逻辑不是国内网络覆盖——中国地面网络已经很发达——而是一带一路沿线国家的地轨卫星互联网市场。同时低纬度轨道资源具有「先占先得」的排他性,中国必须加速抢占。Tony出海 的推文点出了这个很多人没意识到的地缘战略维度。
SpaceX IPO 带动整个商业航天产业链的关注度,国内卫星互联网概念短期会受到刺激。长远看,千帆星座能否在亚非拉市场跑通商业模式才是关键,技术能力反而不是最大瓶颈。
Fable 5 发布 24 小时内社区总结出 8 条共识和 3 个陷阱;同时 Anthropic 保留提示词和使用记录的新政策引发企业用户强烈反弹(Naveen Rao 公开表示无法接受,Yann LeCun 转帖)。
Fable 5 的编码能力确实惊艳——花叔两天做出比 Screen Studio 更好用的录屏工具,实践哥 20 分钟完成以前 2 周的工作。但成本焦虑(计价器哗哗涨)和输出人味缺失是普遍槽点。更大的问题是 Anthropic 的数据保留政策——企业用户担心提示词中包含的 IP 和设计文档被用于训练,这可能成为 Fable 在企业市场的最大阻力。
短期看 Fable 5 会让个人开发者的效率再上一个台阶,但企业采纳会被隐私政策拖慢。如果 Anthropic 不调整政策,会有一批企业用户转向 OpenAI Codex(刚推出 bank/save 速率限制功能)或自部署 Kimi-K2.7-Code 等开源模型。