AI 测试集
ARC-AGI-3
ARC Prize 推出的交互式推理基准测试,衡量 AI 智能体在新环境中通过探索、试错和适应来达成目标的能力。考察长程规划、稀疏反馈下的策略调整和跨步骤适应,不依赖自然语言或预加载知识。
斯坦福 2024 年人工智能指数报告
AI 进展、投资、政策和公众认知的年度资料。

Office
Slidev
面向开发者的幻灯片工具,用 Markdown 写内容,基于 Vite、Vue 和 UnoCSS。支持嵌入 Vue 组件、代码高亮、实时编码、LaTeX 公式和 Mermaid 图表,提供演讲者模式和画笔标注,可导出 PDF/PNG/PPTX。
不需要自己手动折腾安装流程。按 Slidev 官方的 AI 工作流,把对应的 skill 装好即可,VS Code 扩展可以按需安装。
之后只要直接告诉 Agent:`帮我用 Slidev 做一个关于 xxxx 的演示文稿`,它就能开始生成内容和页面。后续如果想本地预览、开始演示、导出 PDF,或者部署到 GitHub Pages、Cloudflare Pages 变成在线网页,也都继续交给 AI 处理就行。OfficeCLI
给 AI Agent 用的 Office 文档命令行工具,单文件、开源免费、不依赖本机 Office。支持读写 Word/Excel/PowerPoint,可将文档渲染成 HTML/PNG 供 Agent 预览并修正排版问题。
HTML 幻灯片模板库
网页演示模板资源库,提供已整理好的 HTML 页面结构和视觉样式,适合产品介绍、项目汇报等场景快速套用。
PPT-master
用 AI 从文档生成原生可编辑 PPTX 的开源工具,输出可直接在 PowerPoint 里修改的文件,支持版式、图文结构和旁白演示。
PptxGenJS 生成可编辑 PPTX 的原理
解释 PPTX 本质、Office Open XML 和 PptxGenJS 生成流程。
Google Slides 作为 PPT 创建和编辑工具
Gemini 3 配合 Google Slides 编辑 PPT 的经验。

语音工具
Supertonic
轻量的本地多语言 TTS 系统,基于 ONNX Runtime 推理,不依赖云端 API。支持 31 种语言和情绪标签,提供 Python/Node.js/浏览器等多种运行示例。
ComfyUI-Qwen-TTS
基于 Qwen3-TTS 的 ComfyUI 自定义节点,支持语音合成、零样本音色克隆和声音设计。支持中英日韩等多语言,适合在 ComfyUI 工作流中集成 TTS。
Eve Recorder
基于 Electron 的桌面录音工具,支持长时间自动录音、智能切割和本地 AI 转写。内置 Qwen3 ASR 和 Silero VAD,支持实时波形可视化和 WAV/FLAC 输出,录音按天归档。
Parlor
语音场景的 AI 对话工具,把大模型接到实时沟通流程,适合做语音助手、电话交互等应用。
VocalRemover [AI]
在线人声消除和隔离工具。
Microsoft ReadingCoach
微软免费口语训练工具,可分析读音、停顿和节奏。




智能体工具
Understand-Anything
用 AI 自动分析 GitHub 仓库,生成结构化的项目理解文档。支持扫描目录结构、分析代码逻辑、提取关键模块,生成架构图和依赖关系图。
claude-mem
面向 AI Coding Agent 的持久记忆系统,自动捕获会话中的工具调用和项目观察,压缩成可检索的长期记忆。通过 SQLite 和向量检索实现分层检索,支持 Claude Code、Gemini CLI 等多种 Agent。
Second Brain
跨 AI 工具的共享持久记忆系统,部署在 Cloudflare 免费套餐上。通过 MCP 连接 Claude、ChatGPT、Cursor、Codex 等客户端。
Cloudflare Agent
Cloudflare 官方 AI Agent 框架,基于全球边缘网络和 Workers 平台构建部署 Agent。深度整合 Durable Objects、KV 存储、网页搜索和浏览器操作,提供开箱即用的调度和任务队列。
HyperFrames
HeyGen 开源的 HTML 动画框架,用声明式 hf-* 属性把 HTML 页面变成交互式动画。基于 Web Animations API,支持入场、出场、滚动触发、点击交互等效果。
FireRed-OpenStoryline
开源 AI 视频编辑 Agent,用自然语言对话代替手动剪辑。整合素材搜索、脚本生成、自动配乐与旁白推荐,支持将剪辑流程保存为可复用 Skill。
MoneyPrinterTurbo
一键生成短视频的 AI 工具,输入主题自动完成文案、素材、字幕、音乐和合成。提供 Web 界面和 API,支持批量生成、多画幅、多种大模型接入。
Jellyfish
AI 短剧创作工作台,从剧本到分镜、角色一致性管理、图片/视频生成到成片导出的完整管线。
Phantom-motion
面向网页动效的开源工具,处理元素入场、转场、滚动触发等动效需求,适合落地页、产品介绍等场景。
Aitoearn:OPC(一人公司)
面向"一人公司"的 AI 工具集,围绕"AI 生成内容→自动化发布→变现"主线,涵盖文案生成、视频制作、SEO 优化、社交媒体自动运营等模块。
自动小说生成工具
让大语言模型按故事框架从大纲到章节到润色全自动完成长篇创作,支持自定义世界观、角色人设、剧情走向和写作风格。
支付宝 AI 机器人发布入口
Gemini Storybook + Grok 半自动生成 AI 视频
6551 的 X + 新闻源 MCP + Skill
把 X 数据、全网新闻源、链上数据打包成可部署的 MCP 与 Skill。

网关工具
AQBot
跨平台 AI 桌面客户端,整合 AI 对话客户端、本地 AI 网关和 Agent 工作台。基于 Tauri 构建,支持多模型接入、多 API Key 管理、知识库 RAG、记忆系统和联网搜索。
ChatGPT 账号能力包装成 OpenAI 兼容网关
多账号池、高并发调度、图片生成、计费和后台管理方案。

图像工具
Remove-AI-Watermarks
AI 图片水印清理工具,一键清除主流 AI 生图模型的可视水印、隐形水印和元数据标记,自动保护人脸不被失真。提供命令行和 Python API。
2api
gemini-web2api
把 Gemini Web 界面转成 OpenAI 兼容 API 的轻量工具,逆向网页端协议,支持 Flash/Pro 等多款模型、function calling、流式输出和联网搜索。纯 Python 实现,可选挂载 Google 账号 cookie 解锁 Pro 路由。
账号与订阅
Gemini Pro 一年免费 pixel 订阅
Gemini Pro 白嫖一年的方法



