终端工具+Agent IDE密集更新日:Pake/Mole/Wox三连发,ORCA开源Agent IDE首次亮相;Open Design正式接入Codex,设计-代码-视频一条龙工作流成型。Anthropic token翻倍+Cursor Composer 2.5推出,Agent工具链进入军备竞赛期。
终端工具+Agent IDE密集更新日:Pake/Mole/Wox三连发,ORCA开源Agent IDE首次亮相;Open Design正式接入Codex,设计-代码-视频一条龙工作流成型。Anthropic token翻倍+Cursor Composer 2.5推出,Agent工具链进入军备竞赛期。
一行命令把任意网页打包成桌面App,Rust/Tauri构建,体积仅~5MB,支持macOS/Windows/Linux。
npm install -g pake-cli && pake https://example.com 即可生成一个原生桌面应用。本次更新修复了Linux Wayland白屏、macOS新窗口崩溃等14个问题,稳定性大幅提升。支持自定义窗口大小、菜单栏、沉浸式边框,适合把Notion/Linear/微信读书等常用网页工具一键转化为独立App。
用Rust+Tauri替代Electron,5MB的体积对比动辄200MB的Electron App是降维打击。v3.11.5修复了该版本最影响体验的几个崩溃Bug,在Wayland和macOS上的稳定性已接近生产可用。
AI驱动的设计工具Open Design正式接入Codex CLI,从设计稿到代码到视频一条龙,Agent可「看着画布改设计」。
git clone https://github.com/nexu-io/open-design && cd open-design && npm install && npm run dev 启动本地服务,然后在Codex中直接引用Open Design进行设计迭代。已集成近400套开箱即用的模板/Skill/设计系统,包括html-anything全部模板。Codex Agent可以读取canvas状态、理解设计意图、生成对应代码。
解决了AI设计最大的痛点——设计意图在迭代中丢失。传统流程是设计→截图→喂给AI→代码→发现不对→再来一次。Open Design+Codex让Agent可以直接看到canvas并进行修改,设计意图不再通过截图这个「窄带宽」传递。
支持多Agent并行、多账号切换的开源IDE,自带iOS/Android客户端,自动检测电脑里装的各类CLI Agent。
克隆仓库后本地运行,支持拖拽文件/目录直接对话。完全基于你自己的API订阅运行——可以同时接入Claude Code CLI、Codex CLI、Gemini CLI、Hermes等多个Agent。自带iOS和Android移动端。
第一个把Agent舰队管理做成IDE的开源项目。传统IDE一次只能用一个Agent,ORCA让你同时开多个Agent并行干活——一个debug、一个写测试、一个重构。
让Coding Agent自己搜索最优的test-time scaling推理策略,替代人工设计的prompt和推理路径。
克隆项目后配置LLM API,Agent会自动针对你的推理任务(数学、编程、逻辑等)搜索最优的test-time scaling策略——包括分步推理、自我验证、多路径投票等各种技巧的组合。输出的是可直接用于生产环境的推理配置。类似AutoML的思路但针对LLM推理。
test-time scaling是2026年LLM的核心优化方向,但一直靠人工设计prompt策略。AutoTTS把这个问题变成了搜索问题,让Coding Agent自己找最优组合,结果往往比人工设计的好。
原生macOS菜单栏系统监控,实时CPU/RAM/网速+自动发现App更新,支持电池健康、磁盘压力等多维度状态。
直接下载安装,菜单栏出现实时HUD——CPU、RAM、网络速度一目了然。亮点是自动检测已安装App的新版本(支持App Store、Sparkle、Electron三类更新源),未更新App会显示badge提醒。状态面板覆盖电池健康、磁盘压力颜色标识、双网络监控。
macOS原生+菜单栏HUD的设计非常克制,不像iStat Menus那么重。自动发现App Store/Sparkle/Electron三类更新源并统一提醒的功能是杀手锵。磁盘压力用颜色标识(绿/黄/红)比看数字直观太多。
老牌跨平台桌面启动器,v2.1.0加入截图、翻译、AI调用等功能,开源跨平台。
下载安装后Alt+Space唤起,输入关键词快速启动应用、搜索文件、执行计算。新增AI集成——可以直接在启动器里调用AI翻译、问答、总结。内置截图功能无需额外工具。支持插件扩展,社区生态成熟(Wox有近10年历史)。
10年老牌项目持续迭代,v2.1.0是近年来最大的功能更新。加入AI能力后从单纯的启动器升级为桌面上的一站式入口。跨平台一致体验对于多设备用户很实用。
一行命令用AI把本地/远程代码仓库变成可读文档,支持CLI和MCP两种接入方式。
npm install -g zread-cli && zread analyze ./my-project 即可对本地代码仓库生成结构化的AI分析文档,包括架构图、模块依赖、核心逻辑解释。MCP模式可接入Claude Code/Codex等Agent工具中,让Agent在分析代码时直接调用zread的理解结果,而不是每次从头读代码。
代码阅读是AI Agent最耗时的步骤之一。zread通过预处理生成代码的结构化理解,Agent可以直接消费这个「预消化」的结果。MCP模式特别实用——相当于给Agent装了个代码速读插件,减少重复解析的时间。
盛大旗下AI实验室训练模型在不同学科自主提出科研假设,ICML 2026收录,代码开源。
关注ICML 2026 proceedings或作者GitHub获取代码。核心思路是post-training一个模型,让它能在物理、化学、生物等不同学科中观察数据→提出假设→设计验证实验。一套方法跨学科通用。
post-training的终极形态不是更好的代码补全,而是科学发现本身。MiroMind证明了一套方法可以跨物理/化学/生物学科提出有意义的科研假设。如果这条路走通,2026年post-training的竞争焦点可能从「写代码」转向「做科研」。
纯前端格斗小游戏,打败阿迪王就能给萃猫的Claude账号解封,AI视频模型当游戏引擎的先锋实验。
浏览器打开即玩,键盘控制角色战斗。游戏本身是个有趣的meme(背景是萃猫Claude被封号),但技术亮点在于作者提出了「AI视频模型就是未来的游戏引擎」的观点。作者表示后续出教程时会展示如何用AI视频模型驱动游戏画面。
虽然是meme项目,但开了一个脑洞:AI视频模型生成的画面可以直接作为游戏帧输出。传统游戏引擎需要建模→贴图→光照→渲染,AI视频模型把这一切压缩成「一句话生成画面」。
让飞书机器人之间互相@对话,支持多角色讨论一个话题,最强模型驱动。
克隆项目后配置飞书Bot凭证,部署后即可让两个或多个飞书Bot互相@讨论你设定的话题。发给GPT-5.5级别的模型安装即可运行。由于飞书原生不支持Bot之间互相@,这个项目通过技术手段绕过了限制。可以设定不同Bot扮演不同角色(产品经理+工程师+设计师)。
多Agent对话在产品讨论、头脑风暴、模拟会议等场景非常实用。飞书作为国内主流协作工具,这个项目让Agent能力直接融入日常工作流。技术上绕过了飞书Bot互@的限制,实现思路巧妙。
Anthropic连续出招——正式收购SDK工具商Stainless,同时宣布所有计划的token limit翻倍。
Stainless此前已为Anthropic维护几乎所有语言的SDK和MCP server,收购后将SDK/MCP开发完全内化。结合token翻倍政策,Anthropic的战略意图清晰——降低开发者的AI使用门槛(token多了)同时收窄生态入口(SDK归我管)。对普通用户直接好处是长对话/大文件处理不再轻易撞墙。
SDK/MCP工具链的集中化可能让开发者更依赖Anthropic生态,同时token翻倍直接提升Claude Design/Agent工作流的用户体验。对竞品(OpenAI/Gemini)构成差异化压力。
Cursor上线自家编程模型Composer 2.5,主打长任务稳定性+复杂指令跟随,首周额度翻倍促销。
Cursor从「套壳各家模型」到「自研编程模型」标志着AI IDE赛道进入自有模型竞争阶段。Composer 2.5训练中引入「文本反馈信用分配」机制,让模型在10万token级长任务中保持指令忠诚度。官方声称效率比同级别模型高10倍。
Cursor自有模型如果跑通,将大幅降低对OpenAI/Anthropic API的依赖,利润率显著改善。对Copilot/Windsurf等竞品构成压力,可能引发AI IDE自研模型军备竞赛。
Qwen 3.7 Max Preview在Chatbot Arena总榜排13,实验室总排名第6,数学/编程赛道进入前十。
数学第7、专家领域第9、软件IT第9、编程第10——四个赛道全面进入前十意味着Qwen 3.7 Max已接近第一梯队。考虑到阿里在Vision赛道还有独立优势(Qwen-VL系列),Qwen 3.7的完整版(含Vision/多模态)可能更强。
国产开源模型在Arena上逼近GPT/Claude/Gemini,对国内企业选型有示范效应。如果能维持开源策略,将加速国内AI应用的模型底座迭代。
加州联邦法院陪审团一致裁定马斯克对OpenAI/Sam Altman的诉讼超过法定时效,全部主张被驳回,陪审团评议不到2小时。
马斯克核心主张是OpenAI背离了非营利初心,但法院以「告晚了」为由不予审理实质内容。陪审团不到2小时的一致裁决表明案件在程序层面就缺乏争议空间。这是马斯克vs OpenAI系列诉讼中最决定性的一次败诉。
OpenAI可以更自由地推进商业化转型(盈利子公司架构),不再受马斯克法律威胁掣肘。但「非营利变营利」的伦理争议不会因此消失,只是从法庭转向舆论场。