World's first open-source, agentic video production system. 12 pipelines, 52 tools, 500+ agent skills. Turn your AI coding assistant into a full video production studio.
Python
1,932
358
GNU Affero General Public License v3.0
11小时前
Identifying and removing near-duplicate images using perceptual hashing.
Python
388
24
13小时前
Speech recognition API service powered by FunASR and Qwen-ASR, supporting 52 languages, compatible with OpenAI API and Alibaba Cloud Speech API. 基于 FunASR 与 Qwen3-ASR 的语音识别 API 服务,支持 52 种语言,兼容 OpenAI API 与阿里云语音 API。
Python
245
37
14小时前
A local-only monitoring tool for AI coding agents.
Python
170
12
MIT License
12小时前
Telegram MCP server powered by Telethon to let MCP clients read chats, manage groups, and send/modify messages, media, contacts, and settings.
Python
934
237
Apache License 2.0
15小时前
An extremely fast implementation of whisper optimized for Apple Silicon using MLX.
Python
915
65
12小时前
mustafaaljadery/lightning-whisper-mlx cover
A Productivity Timer Using a Hidden Camera and OpenCV with Raspberry Pi
Python
37
3
GNU General Public License v3.0
17小时前
Thoth是一款本地优先的个人AI助手,强调AI主权和数据隐私。它集成了25种工具(含69个子操作),包括网络搜索、邮件日历、文件管理、Shell访问、浏览器自动化、视觉图像、知识图谱记忆、工作流任务等功能,支持本地Ollama运行和可选云端模型,确保所有数据保存在用户本地设备。
Python
158
22
Apache License 2.0
14小时前
siddsachar/Thoth cover
OmniVoice Studio是一个本地的AI配音工作室,支持视频配音、语音克隆和音频生成。基于OmniVoice开源模型,无需API密钥,本地运行,提供时间轴界面、人声分离、多平台加速和精细音频控制等功能。
Python
119
13
Apache License 2.0
12小时前
debpalash/OmniVoice-Studio cover
一个为Claude Code/Open Code/Codex等AI编码工具设计的结构化深度研究技能库,支持两阶段研究流程(提纲生成与深度调查),采用人机协作设计确保精准控制。适用于学术、技术、市场和尽职调查等研究场景。
Python
431
42
16小时前
Stability AI开发的生成模型仓库,专注于视频生成与多视角合成,特别是SV4D 2.0模型,可从单视角视频生成高保真度4D资产和多视角动态视频。
Python
27,090
3,071
MIT License
19小时前
Stability-AI/generative-models cover
CCGram是一个Telegram到tmux的桥接工具,允许用户通过手机远程监控和管理在终端中运行的AI编程助手会话,包括Claude Code、Codex CLI、Gemini CLI等。它通过读取tmux窗口输出和发送键盘输入实现无缝控制,支持并行会话管理。
Python
79
23
MIT License
1天前
为Rita.ai提供OpenAI兼容的反向代理服务,支持多账号轮换、自动注册补号,并包含WebUI管理面板,便于搭建和管理私有代理接口。
Python
70
39
1天前
MOSS-TTS-Nano是一个开源的轻量级多语言语音生成模型,仅0.1B参数,专为实时语音合成设计。它无需GPU即可在CPU上运行,部署简单,适用于本地演示、Web服务和轻量级产品集成。
Python
1,035
102
Apache License 2.0
11小时前
OpenMOSS/MOSS-TTS-Nano cover
etlp 是一个油猴脚本工具,允许用户在 Emby/Jellyfin/Plex 媒体服务器中调用 PotPlayer、mpv、IINA、VLC 等本地播放器打开视频,并支持回传播放进度和连续播放。它通过配置播放器路径和油猴脚本实现,提升了网页端播放的灵活性和体验。
Python
1,312
69
Apache License 2.0
22小时前

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-16 13:51
浙ICP备14020137号-1 $访客地图$