今天最值得动手看的主线是“Agent 进入真实工作流”:一边是给 AI Agent 用的浏览器、网页动画 Skill、Google Workspace CLI,另一边是 Apple 亲自下场做 macOS 容器工具。实用 App 也不少,Android+Mac 融合、WebDAV 菜单栏服务器、SEO 工具和可玩的 Steam 小游戏都能马上试。
今天最值得动手看的主线是“Agent 进入真实工作流”:一边是给 AI Agent 用的浏览器、网页动画 Skill、Google Workspace CLI,另一边是 Apple 亲自下场做 macOS 容器工具。实用 App 也不少,Android+Mac 融合、WebDAV 菜单栏服务器、SEO 工具和可玩的 Steam 小游戏都能马上试。
这是一个给人和 AI Agent 同时使用的 Chromium 浏览器,让 Agent 在独立 Space 里跑网页任务,不抢你的标签页和登录态。
打开官网点击 Download for Mac,或从 GitHub README 里的 Apple Silicon / Intel DMG 链接下载安装;首次启动时可选择迁移 Chrome 的书签、扩展、Cookie、登录状态和浏览器配置。之后在支持技能的 Agent 里使用 ego-browser,例如让 Agent 执行网页整理、表单填写、资料抓取等任务。页面和 README 都提到它会把任务放进独立 Space,并通过 snapshot、fill、click、wait、navigate、capture 等能力让 Agent 用 JavaScript 一次性组合多步网页操作。
传统浏览器自动化常卡在登录、2FA、SSO、验证码和多标签冲突上;ego lite 的思路是把日常浏览器和 Agent 浏览器合并,同时用 Space 隔离任务。它还明确支持 Claude Code、Codex、Cursor、Hermes Agent 等多种 Agent,对“让 AI 真正操作网页后台”这件事很关键。
这是 Mac 上连接 Android 手机的工具,支持 Finder 管理手机存储、屏幕镜像、剪贴板同步和 Mac 键盘输入。
访问官网可直接下载 AndroMeld_v0.0.2.dmg,也可进入 Mac App Store 页面安装。安装后在 Android 手机开启开发者选项里的 USB Debugging,通过 USB 连接获得更稳定和高带宽的体验,或使用 Wireless ADB 在同一局域网无线连接。连接成功后,可在 Finder 侧边栏访问 Android 存储,拖拽文件、按空格 Quick Look;也可以开启屏幕镜像,把手机画面和音频投到 Mac,并用 Mac 键盘输入 Android App 内容。
它把 Android Debug Bridge、Finder 文件系统映射、屏幕投射、剪贴板同步这些能力整合成一个 Mac 原生体验,目标是给 Android 手机做类似 Apple Continuity 的跨设备融合。页面还说明数据在本机点对点传输,不需要账号,也不上传文件和使用记录。
这是一个可复制粘贴的 Web App 动画过渡效果集合,还提供可安装 Skill 让 Agent 给网页加动画。
打开 transitions.dev 后可以直接浏览 Card resize、Number pop-in、Notification badge、Text states swap、Menu dropdown、Modal open/close、Panel reveal、Page side-by-side、Icon swap、Success check、Error state shake 等示例,挑一个适合项目的过渡效果复制到自己的前端项目里。推文给出的 Agent 玩法是运行 `npx skills add jakubantalik/transitions.dev` 安装 Skill,之后让支持 Skills 的 Agent 阅读该技能并把合适的动画过渡集成到你的网页组件中。
AI 写前端时常能做出“能用”的界面,但细节动效很容易粗糙。这个站点把常见交互场景沉淀成可复用过渡,配合 Agent Skill 后,等于把“加一点精致动效”的设计经验变成可调用能力,适合快速提升 AI 生成页面的质感。
Apple 开源的 macOS Linux 容器运行工具,用 Swift 编写,面向 Apple Silicon 和 macOS 26。
进入 GitHub 仓库或 Releases 页面下载签名安装包,按 README 说明双击 pkg 安装,安装文件会放到 /usr/local,升级可使用 releases 或 `/usr/local/bin/update-container.sh`。它需要 Apple Silicon Mac,并且支持 macOS 26;安装后可拉取和运行 OCI 兼容镜像,也可构建并推送镜像到标准 registry。若要从源码构建,仓库提供 BUILDING.md。注意 README 明确表示不支持旧版 macOS,遇到问题最好先确认系统版本。
Mac 上跑 Linux 容器长期依赖 Docker Desktop、Colima、OrbStack 等第三方方案。Apple 自己开源一个基于 Swift、优化 Apple Silicon、使用 OCI 镜像的容器工具,说明 macOS 原生虚拟化与容器开发体验正在成为一等公民,对本地开发、Agent 沙箱和轻量服务运行都有影响。
Google Workspace 的命令行工具,覆盖 Drive、Gmail、Calendar、Sheets、Docs、Chat、Admin 等 API,并面向 AI Agent 输出结构化 JSON。
进入 GitHub Releases 下载适合系统的预构建二进制,例如 Apple Silicon macOS、Intel macOS、Windows、Linux 等包;解压后把 `gws` 放进 PATH。README 推荐有 gcloud 的本地机器运行 `gws auth setup`,也支持手动 OAuth、环境变量 token、credentials 文件等方式。认证完成后可用 `--help` 查看资源和方法,用 `--dry-run` 预览请求,成功输出为结构化 JSON,适合被脚本或 AI Agent 继续处理。
这个工具不是静态手写命令,而是运行时读取 Google Discovery Service 动态构建命令面;当 Google Workspace 新增 API endpoint 时有机会自动覆盖。对 Agent 来说,结构化 JSON 输出和内置 40+ agent skills 能显著降低操作 Gmail、Drive、Calendar、Sheets 的集成成本。
一款 macOS 菜单栏 WebDAV 服务器,可以把任意本地文件夹一键变成局域网 WebDAV 共享。
https://www.appinn.com/webdav-lite-for-macos/ ↗
https://apps.apple.com/app/webdav-lite-lan-file-server/id6779282964 ↗
从 App Store 安装 WebDAV Lite(文章提示无国区),启动后它常驻 macOS 菜单栏。选定要共享的 Mac 文件夹并开启服务,局域网里的 iPad、Apple TV、Infuse、VLC、Finder 等 WebDAV 客户端即可访问。文章还提示当前是内购限免:进入 App 内购买页面,看到 Full Unlock 为 $0.00 时可直接解锁高级版。工具支持 HTTPS 加密、密码保护、读写和 LOCK/UNLOCK,并会过滤 .DS_Store、.git 等冗余文件。
很多人只想在局域网临时共享一个目录给播放器、平板或另一台电脑,不想折腾 NAS、Samba 或复杂命令。WebDAV Lite 把这件事做成菜单栏一键操作,且原生 SwiftUI、支持 Apple Silicon & Intel,适合轻量文件同步和串流。
一个面向 SEO 的 AI 工具站,提供标题、描述、关键词、FAQ、功能点、证言等生成和改写工具。
打开 aitdk.com 后可从首页进入 AI Title Generator、AI Description Generator、AI Keywords Generator、AI FAQ Generator、AI Feature Generator、AI Testimonial Generator,也可以使用对应的 Rewriter 工具。页面强调 no credit card required、instant results、works in every language。推文还提到订阅用户可以查看网站 DR、外链、AI 访问量趋势、Adsense 关联网站等,适合站长在做外链建设和竞品调研时进一步使用。
SEO 工具通常分散在关键词、标题、描述、FAQ、竞争分析等多个环节;AITDK 把生成与改写集中到一个轻量入口,又叠加站点指标、外链和 AI 访问趋势,对于出海独立站和内容站来说能减少很多重复劳动。
一个把知识、文档和想法转成讲解视频、幻灯片、播客、TTS 配音和克隆声音内容的 AI 内容平台。
进入 listenhub.ai 后可按任务选择入口:Explainer Video 用于做知识讲解视频,Slides 用于生成演示文稿,AI Podcast 可把视频、PDF 或文档转成播客,Text to Speech 用于把文字转成自然语音,也可让 AI 改写成更适合口播的版本。页面每个模块都有 Try It Out 入口,例如 `/app/explainer`、`/app/slides`、`/app/podcast`、`/app/text-to-speech`。推文提到团队接下来会把 Seed Audio 接入 ListenHub,音频内容创作体验会继续增强。
多模态内容生产正在从“单点生成图片/语音”转向“把一份知识改造成视频、幻灯片、播客和配音素材”。ListenHub 已经把这些内容形态放在同一平台里,适合教育、品牌和自媒体把同一主题快速分发到 YouTube、TikTok、Podcast 等渠道。
一款 Steam 上的多人捉迷藏派对游戏,玩家通过给白色身体上色来伪装进场景。
打开 Steam 商店页搜索 MECCHA CHAMELEON 或直接访问链接购买/安装。游戏把玩家分为 Seeker 和 Hider,Seeker 要在时间限制内找出所有人;Hider 则需要把自己的白色身体涂成和场景相近的颜色,选好躲藏点、摆姿势并用“绘画技术”骗过搜寻者。商店页说明支持公开和私密服务器,可和朋友玩,也可让陌生人加入;主播也能开观众参与局,官方推荐 2–10 人。
它把绘画、伪装、捉迷藏和多人派对结合起来,不是单纯跑图或躲柜子,而是考验玩家对背景颜色、姿势和视觉欺骗的创造力。Steam 页面显示评价为 Very Positive,且支持简体中文界面和字幕,适合马上拉朋友体验。
多位博主讨论 Claude Tag,它让 Claude 以“团队成员”的方式常驻 Slack 频道,被 @ 后可拆解任务、写 PR、做分析并在线程里交付。
这不是单纯把聊天机器人塞进 Slack,而是把 Agent 的上下文边界改成 channel based context:频道就是工作域,线程就是任务交付空间。它强调长期存在、异步运行、跨工具接入和组织工作流,而不是用户每次主动打开一个聊天窗口。对企业来说,这种形态更接近“数字员工”而不是“AI App”。
如果 Claude Tag 这类模式跑通,企业 AI 的竞争重点会从模型问答能力转向权限、审计、频道上下文、工具集成、记忆和工作流治理。Slack、Teams、飞书、钉钉等协作平台都可能成为 Agent 分发入口,传统 SaaS 也需要考虑如何被频道里的 Agent 调用。
OpenAI 官方博客总结 Codex Remote 的 10 个工程使用最佳实践,强调手机是“控制面”而不是“终端”。
官方文章的核心心智是:代码仍运行在 Mac、Windows、devbox 等真实开发环境中,手机只负责选择 repo、branch、worktree、排队任务、转向执行、审查 diff 和批准命令。这说明移动端工程工具的价值不在于把终端缩小,而是让关键决策不必等用户回到电脑前,尤其适合长时间运行的 Agent 任务。
远程 Agent 编程会推动 IDE、CLI、移动 App 和权限审批体系重新组合。未来工程师可能白天在电脑深度开发,路上用手机审批命令、追加测试、查看 diff;团队也需要更细的权限模型、任务归档、线程管理和可回滚机制来支持这种异步协作。
多条推文提到字节发布或预告 Seedance 2.5、Seedream 5.0 Pro、Doubao Seed 2.1 等模型,重点包括 30 秒视频、原生 4K、50 个多模态参考、3D 白模和办公/编程能力提升。
从讨论热度看,国产多模态模型正在从“能生成”进入“可控生产”阶段:更长视频、更高清分辨率、更多参考素材、更复杂的编辑能力,以及接入豆包桌面、Trae IDE、火山引擎等实际产品渠道。模型能力本身重要,但更重要的是它们开始被包装进办公、编程、视频制作和版权商业化平台。
短视频、广告、游戏宣发和 IP 二创会首先感受到冲击,因为 30 秒、4K、多参考素材已经接近商业素材生产需求。对工具创业者来说,底层模型更新会迅速抬高产品基线,差异化将更多来自工作流、素材管理、版权、审稿、分发和团队协作。
博主提到 Mistral 发布 OCR 4,支持 170 种语言和置信度评分;另有讨论称百度开源 Unlimited OCR,3B 参数、500M 激活。
OCR 正在从“识别图片里的字”升级成文档理解基础设施:多语言、置信度、长文档、版面结构、表格、公式和低成本推理都成为竞争点。推文中的 Mistral OCR 4 不是开源模型,但强调语言覆盖和置信度;百度方向则被关注在小模型和开源效率上。
RAG、合同审阅、票据处理、教育题库、财务报销、档案数字化都会受益。随着 OCR 模型更便宜、更准、更能处理长文档,很多过去依赖人工校对或昂贵 API 的流程会被重新自动化,文档型 Agent 的可靠性也会随之提高。