📡 AI 资讯日报

2026-06-23
🔥 今日主线

今天的主线很明确:一边是“能立刻跑”的个人工具和开源项目密集出现,覆盖备份、视频、语音输入、Mac/iOS维护、Markdown导出;另一边是多模型/多智能体编排继续产品化,Fugu、AWS Agent Toolkit、Apodex 都在把复杂 Agent 工作流包装成更易接入的入口。

🛠️ ReSo Backup

一个基于 Reed-Solomon 纠删码和 AES-256-GCM 加密的开源文件备份工具,把文件拆成多份分片,丢掉几份也能恢复。

https://github.com/Nigh/ReSoBackup ↗

到 GitHub Releases 下载对应 Windows、macOS 或 Linux 的可执行文件;新手直接运行 `rsbackup` 打开 GUI,选择要保护的文件,设置 shares 和 threshold,比如 5 份分片、任意 3 份可恢复,再勾选加密并输入密码。备份后把 `.rs.001` 到 `.rs.005` 分散放到不同网盘和本地硬盘。恢复时把任意满足阈值的分片放到同一目录,选择任意 `.rs.NNN` 或 `.rsmeta` 文件执行 restore 即可。命令行也可用 `rsbackup backup --input 合同.pdf --shares 5 --threshold 3 --encrypt --password "你的密码"`。

它把“加密备份”和“容灾冗余”合在一起,不依赖同一个云盘、不需要联网验证,也不是简单压缩包单点存储。Reed-Solomon 的 N/K 阈值设计让用户能在存储成本和容灾能力之间自己取舍,适合长期保存重要资料。

原文链接
🛠️ Boogu-Image-0.1

一个 Apache-2.0 开源的图像生成与编辑模型家族,主打中英文文字渲染、海报/文档类图像生成和图片编辑。

https://huggingface.co/Boogu/models ↗

最省事的入口是打开在线 Demo:Base 用 https://demo-base.boogu.org/,Edit 用 http://demo-edit.boogu.org/,Turbo 用 http://demo-turbo.boogu.org/。想本地跑则在 Hugging Face 选择 `Boogu/Boogu-Image-0.1-Base`、`Turbo` 或 `Edit`,按模型卡安装 diffusers、transformers、accelerate 后,用 `DiffusionPipeline.from_pretrained("Boogu/Boogu-Image-0.1-Base", dtype=torch.bfloat16, device_map="cuda")` 加载模型,输入包含中文标语、版式、摄影风格或编辑需求的 prompt 生成图片。Turbo 版本用于 4-step 快速文生图,Edit 版本用于图像到图像编辑。

开源图像模型长期弱项之一是准确写字,尤其是中文和密集文本版式。Boogu 明确把中英文文字渲染、海报、文档、界面、品牌物料和精细文本编辑列为重点能力,并提供 Base/Turbo/Edit/fp8 多个版本,方便从在线试玩过渡到本地实验。

原文链接
🛠️ ZWPlayer 3.3.0

一个免费的网页视频播放器/互动视频套件,一个 JS 文件即可接入,支持 HLS、DASH、FLV、WebRTC、RTSP 等协议,并新增交互标注、水印、字幕、播放列表等在线编辑器。

https://www.zwplayer.com/zh/tools/videoplayer/ ↗

可以先打开官方在线播放器页面,拖入本地视频或填入网络流媒体地址测试播放;要集成到项目里,可下载 GitHub Release 的 `zwplayer-v3.3.0-build20260622.zip`,或直接用 `<script src="https://cdn.zwplayer.com/v3/zwplayer/zwplayer.js"></script>` 引入。3.3.0 的玩法重点是工具链:进入交互标注编辑器、水印编辑器、字幕编辑器、章节编辑器或播放列表生成器,拖拽配置后导出 ZWMAP JSON,再让播放器加载对应 JSON。WordPress 用户还可以安装 `zw-player-video-embed` 插件,用古腾堡区块属性配置互动视频。

它不是单纯“能播视频”的 H5 播放器,而是把播放、编辑、配置生成、互动热区、防录屏水印和字幕章节统一到一套在线工具链里。对课程、培训、营销视频来说,低代码生成 JSON 后直接加载,比重新开发互动播放器省很多时间。

原文链接
🛠️ CertLock

一个 Windows 单文件便携工具,通过系统原生 SRP 软件限制策略封禁软件发布者证书,从源头阻止某类流氓软件运行。

https://github.com/zhaofeiy2002-ctrl/certlock ↗

从 GitHub 仓库或 Release 获取 `CertLock.exe`,在 Windows 10/11 上以管理员身份运行;把想要封禁的已签名 `.exe`、`.dll`、`.msi` 或安装包拖入/选择,工具会提取其 X.509 签名证书,并写入 Windows Software Restriction Policy 规则。之后同一厂商证书签名的软件即使换目录、重命名或重新下载,也会被系统策略拦截。项目也支持哈希封禁和规则管理。注意 README 明确提示 PyInstaller 单文件可能被杀软误报,使用前最好阅读源码和 VirusTotal 说明。

它不靠后台常驻、不装驱动、不改 hosts,也不是传统杀毒规则,而是利用 Windows 自带的证书级执行限制。对反复安装、自动拉起、换壳更新的软件族群,证书层封禁比删文件或卸载更持久。

原文链接
🛠️ Mole 1.8.0

一款原生 macOS 维护应用,把缓存清理、应用卸载、系统优化、磁盘地图和状态监控整合到一个本地工具里。

https://mole.fit/ ↗

访问官网下载安装 Mole,macOS 14+ 的 Apple Silicon 和 Intel Mac 都支持;免费试用可先扫描再决定是否购买。打开后可以用 Earth/Cleanser 清理 App 缓存、浏览器临时文件、Xcode build、npm/pip 下载、Slack/Discord/Adobe/ChatGPT/Claude 残留等 11 类垃圾;用 Mars/Forgetter 卸载应用并查找 preferences、Application Support、caches、launch agents、login items 等残留;用 Jupiter/Cartographer 查看磁盘 treemap 并从地图里丢弃文件夹;用 Sun/Heart 查看 CPU、内存、GPU、磁盘 I/O、网络、电池、温度和进程状态。1.8.0 还新增电池护理、Apple Silicon 风扇控制、更快更新和更流畅磁盘地图。

Mac 清理类工具常见问题是过度推销、后台扫、乱删。Mole 的页面强调本地扫描、无遥测、删除前展示文件列表和字节数、可恢复操作进废纸篓,定位更克制;同时把 DaisyDisk/iStat/CleanMyMac/App Uninstaller 类能力浓缩成一个轻量原生应用。

原文链接
🛠️ Voice Key

一个开源桌面语音输入应用,按住快捷键说话、松开后把识别文本输入到当前光标位置,支持 macOS 和 Windows。

https://buildwithais.github.io/voicekey/ ↗

打开官网点击 Download App,或到 GitHub Releases 下载最新版;安装后先配置智谱 AI/GLM 的语音转写 API Key。macOS 因为应用未签名,若提示损坏需要按 README 的安全说明处理,并在“系统设置 → 隐私与安全性 → 辅助功能”为 Voice Key 授权,因为它需要监听按键并模拟输入。配置完成后,在任意聊天框、编辑器、浏览器输入框里按住设定热键说话,松开后自动转写并输入。开发者也可以拉取源码,基于 Electron、React、Vite、TypeScript、TailwindCSS、shadcn/ui 和 Zustand 本地改造。

它把语音转文字从“打开单独录音 App”变成系统级输入方式,适合高频短文本输入。开源形态让用户能审计快捷键、权限和 API 调用逻辑,也便于替换后端转写服务或做团队内部定制。

原文链接
🛠️ Agent Toolkit for AWS

AWS 给 AI 编码代理准备的工具包,通过 MCP、技能和受控 AWS API 访问,让 Claude Code、Cursor、Codex、Kiro 等代理更可靠地构建、部署和排障 AWS 应用。

https://aws.amazon.com/products/developer-tools/agent-toolkit-for-aws/ ↗

访问 AWS 官方页面,按你的编码代理选择对应接入方式:支持插件、MCP Server 配置或把 AWS 技能安装进兼容代理。核心思路是让代理不要只靠模型记忆猜 AWS API,而是通过 AWS MCP Server 获取当前文档、API reference、最佳实践、受控 AWS API 操作和复杂工作流技能。接入后可以让代理执行更具体的任务,比如创建 production-ready VPC、把 Lambda 接到 API Gateway、部署 ECS 容器应用、调查 CloudWatch 日志/指标或 CloudFormation stack 状态。企业环境中可通过 IAM、CloudWatch 和 `aws:CalledViaAWSMCP` 区分并审计代理行为。

AI 编码代理做云基础设施最怕“知识过期 + 权限失控 + 调错 API”。AWS 官方把文档、API、审计、IAM guardrails 和工作流技能打包,等于给代理加了一层生产环境上下文,能降低 token 浪费和误操作风险。

原文链接
🛠️ Apodex

一个面向 deep research 和长链推理的重型 AI 求解器,强调多阶段推理链设计、执行、审查和验证。

https://www.apodex.ai/ ↗

访问 https://www.apodex.ai/ 注册或登录体验。根据推文,现阶段可免费使用,适合把原本需要 GPT/Gemini 深度研究的复杂问题交给它。页面介绍其 Apodex pipeline 会先设计 reasoning chain,再严格执行每一步,随后检查逻辑一致性并决定结论;Deep Mode 强调 verification gates。实际使用时可以把研究问题写成清晰任务,例如“调研某开源项目的竞品、商业模式和技术风险”,要求输出引用、证据和结论;对需要金融、科学、数学或多文档比较的问题,建议明确要求逐步验证和列出不确定性。

它的卖点不是普通聊天,而是把“深、慢、可验证”的 System 2 thinking 产品化,并强调 300 步推理链上的累计准确率目标。对于需要长链分析、交叉核验和多轮子任务的 research 场景,和通用聊天模型的使用方式明显不同。

原文链接
🛠️ Markdown Viewer / docu.md

一个 Markdown 转 Word/预览工具,支持 PlantUML、Mermaid、Vega、drawio、Canvas、Graphviz、LaTeX 公式、代码高亮和 29 套主题,本地处理并可一键导出 Word。

https://docu.md/ ↗

打开 docu.md 按平台安装:Chrome/Chromium 扩展、Firefox 扩展、VS Code 扩展,或查看其 GitHub 开源项目。安装后用它打开 Markdown 文件,文中的 Mermaid、PlantUML、Vega/Vega-Lite、drawio、Graphviz DOT、LaTeX 公式和代码块会被渲染成适合阅读和导出的格式;需要交付 Word 时点击下载/导出即可生成带高清图、可编辑 Word 公式、语法高亮和专业主题的文档。技术文档可以先选 Technical/Academic/Business 等主题,再导出给非技术同事或客户。

很多 Markdown → Word 流程会在流程图、公式、代码和表格上翻车,最后还要手工截图和调格式。这个工具明确把复杂图表和公式转换作为核心能力,且本地处理、免费、开源,更适合技术写作交付。

原文链接
📡 Sakana AI 发布 Fugu:把多智能体系统包装成一个模型 API

Sakana AI 发布 Fugu 和 Fugu Ultra,用户通过 OpenAI-compatible API 调用一个端点,背后由系统动态编排多个模型/智能体完成复杂任务。

Fugu 的关键不是又一个单模型,而是“multi-agent system as a model”:它把模型选择、角色分工、任务拆解、协调和验证隐藏在一个 API 后面,开发者可以像换模型一样接入多智能体系统。官方还把 TRINITY、Conductor 等 learned orchestration 研究作为基础,说明模型编排正在从手写 workflow 走向学习型 coordinator。

如果这类模式成立,应用开发者未来可能更少手写 agent graph,而是把难题交给可配置的“模型池编排端点”。这会冲击传统单模型路由、RAG 工作流和企业多模型管理方式,也会让 API 供应商围绕“质量/延迟/成本/合规可控的模型组合”竞争。

原文链接
📡 百度 Qianfan-OCR / Unlimited OCR 方向继续刷新文档智能模型讨论

多位博主讨论百度新开源 OCR/文档智能模型,重点提到多页文档、R-SWA/恒定 KV Cache、端到端文档解析与 image-to-Markdown 等能力。

Qianfan-OCR 的公开资料显示,它是 4B 参数端到端文档智能模型,统一文档解析、布局分析、OCR、表格/公式/图表理解和 key information extraction,并支持 Layout-as-Thought。推文中提到的 Unlimited OCR/R-SWA 则指向长文档解析时 KV Cache 不随输出长度爆炸的方向,这正是传统“逐页 OCR + 拼接”流程的痛点。

文档智能正在从传统 OCR pipeline 向视觉语言模型端到端解析迁移。对企业报表、合同、票据、考试卷、论文和档案处理来说,未来竞争点不只是识别率,而是多页上下文、布局推理、Markdown/JSON/HTML 结构化输出和长文档成本控制。

原文链接
📡 Micron 与 Anthropic 达成多年期内存和存储战略合作

Micron 宣布与 Anthropic 围绕 Claude 工作负载达成多年期 HBM、DRAM 和 SSD 合作,同时 Micron 内部也将部署 Claude。

这类合作说明 AI 模型训练和推理已经深入影响上游存储/内存架构设计。Anthropic 不只是采购硬件,而是和供应商围绕模型工作负载共同优化内存与存储;Micron 则同时扮演供应商、合作伙伴、客户和投资者角色,把 AI 需求绑定到下一代产品路线。

HBM、DRAM、SSD 不再只是通用算力配套,而会围绕大模型上下文、推理吞吐、训练通信和能效做协同设计。产业链上游厂商与模型公司的绑定会更紧,也可能让头部模型公司的硬件议价与供应保障能力继续增强。

原文链接

🎯 值得关注