World's first open-source, agentic video production system. 12 pipelines, 52 tools, 500+ agent skills. Turn your AI coding assistant into a full video production studio.
Identifying and removing near-duplicate images using perceptual hashing.
Speech recognition API service powered by FunASR and Qwen-ASR, supporting 52 languages, compatible with OpenAI API and Alibaba Cloud Speech API. 基于 FunASR 与 Qwen3-ASR 的语音识别 API 服务,支持 52 种语言,兼容 OpenAI API 与阿里云语音 API。
A local-only monitoring tool for AI coding agents.
Telegram MCP server powered by Telethon to let MCP clients read chats, manage groups, and send/modify messages, media, contacts, and settings.
An extremely fast implementation of whisper optimized for Apple Silicon using MLX.
A Productivity Timer Using a Hidden Camera and OpenCV with Raspberry Pi
Thoth是一款本地优先的个人AI助手,强调AI主权和数据隐私。它集成了25种工具(含69个子操作),包括网络搜索、邮件日历、文件管理、Shell访问、浏览器自动化、视觉图像、知识图谱记忆、工作流任务等功能,支持本地Ollama运行和可选云端模型,确保所有数据保存在用户本地设备。
OmniVoice Studio是一个本地的AI配音工作室,支持视频配音、语音克隆和音频生成。基于OmniVoice开源模型,无需API密钥,本地运行,提供时间轴界面、人声分离、多平台加速和精细音频控制等功能。
一个为Claude Code/Open Code/Codex等AI编码工具设计的结构化深度研究技能库,支持两阶段研究流程(提纲生成与深度调查),采用人机协作设计确保精准控制。适用于学术、技术、市场和尽职调查等研究场景。
Stability AI开发的生成模型仓库,专注于视频生成与多视角合成,特别是SV4D 2.0模型,可从单视角视频生成高保真度4D资产和多视角动态视频。
CCGram是一个Telegram到tmux的桥接工具,允许用户通过手机远程监控和管理在终端中运行的AI编程助手会话,包括Claude Code、Codex CLI、Gemini CLI等。它通过读取tmux窗口输出和发送键盘输入实现无缝控制,支持并行会话管理。
为Rita.ai提供OpenAI兼容的反向代理服务,支持多账号轮换、自动注册补号,并包含WebUI管理面板,便于搭建和管理私有代理接口。
MOSS-TTS-Nano是一个开源的轻量级多语言语音生成模型,仅0.1B参数,专为实时语音合成设计。它无需GPU即可在CPU上运行,部署简单,适用于本地演示、Web服务和轻量级产品集成。
etlp 是一个油猴脚本工具,允许用户在 Emby/Jellyfin/Plex 媒体服务器中调用 PotPlayer、mpv、IINA、VLC 等本地播放器打开视频,并支持回传播放进度和连续播放。它通过配置播放器路径和油猴脚本实现,提升了网页端播放的灵活性和体验。


