Note: This README is entirely generated by AI and is for reference only.
注意:本 README 完全由 AI 生成,仅供参考。
A comprehensive subtitle processing service that automatically downloads, transcribes, and manages video subtitles from various platforms. Features a Telegram bot interface and a web management portal.
-
Multi-Platform Support
- YouTube video subtitle extraction
- Bilibili video subtitle processing
- Automatic fallback to audio transcription
-
Subtitle Processing
- Direct subtitle download from platforms
- Audio transcription using FunASR
- Support for multiple subtitle formats (SRT, VTT, JSON3)
-
User Interfaces
- Telegram Bot for easy access
- Web interface for subtitle management
- Real-time subtitle viewing and searching
-
File Management
- Automatic file organization
- Metadata tracking
- Timeline visualization
-
Readwise Integration
- Automatic article creation from subtitles
- Rich text formatting support
- Seamless sync with Readwise Reader
- Smart content segmentation for long videos
- Backend: Python Flask
- Frontend: HTML/CSS/JavaScript
- Transcription: FunASR
- Container: Docker
- Storage: JSON-based file system
- Clone the repository
- Install Docker and Docker Compose
- Configure environment variables:
TELEGRAM_TOKEN=your_telegram_bot_token READWISE_TOKEN=your_readwise_token
- Start the services:
docker-compose up --build
-
Telegram Bot
- Send video URL to the bot
- Receive processed subtitle file
-
Web Interface
- Access
http://localhost:5000
- Upload video files or URLs
- View and search subtitles
- Access
-
Readwise Integration
- Automatically creates articles in Readwise Reader
- Preserves video metadata (title, URL, publish date)
- Intelligently splits long content into readable segments
- Access transcripts alongside your other reading materials
MIT License
Special thanks to:
- Windsurf - The world's first agentic IDE that made this project development possible
- Claude 3.5 Sonnet - For providing comprehensive AI assistance throughout the development process
一个综合性的字幕处理服务,可以自动下载、转录和管理来自各种平台的视频字幕。提供 Telegram 机器人接口和网页管理门户。
-
多平台支持
- YouTube 视频字幕提取
- Bilibili 视频字幕处理
- 自动音频转录备选方案
-
字幕处理
- 直接从平台下载字幕
- 使用 FunASR 进行音频转录
- 支持多种字幕格式(SRT、VTT、JSON3)
-
用户界面
- Telegram 机器人便捷访问
- 网页字幕管理界面
- 实时字幕查看和搜索
-
文件管理
- 自动文件组织
- 元数据跟踪
- 时间轴可视化
-
Readwise 集成
- 自动从字幕创建文章
- 支持富文本格式
- 与 Readwise Reader 无缝同步
- 智能分段处理长视频内容
- 后端:Python Flask
- 前端:HTML/CSS/JavaScript
- 转录:FunASR
- 容器:Docker
- 存储:基于 JSON 的文件系统
- 克隆仓库
- 安装 Docker 和 Docker Compose
- 配置环境变量:
TELEGRAM_TOKEN=你的_telegram_机器人_token READWISE_TOKEN=你的_readwise_token
- 启动服务:
docker-compose up --build
-
Telegram 机器人
- 向机器人发送视频 URL
- 接收处理好的字幕文件
-
网页界面
- 访问
http://localhost:5000
- 上传视频文件或 URL
- 查看和搜索字幕
- 访问
-
Readwise 集成
- 自动在 Readwise Reader 中创建文章
- 保留视频元数据(标题、URL、发布日期)
- 智能分割长内容为易读片段
- 在其他阅读材料旁边访问转录文本
MIT 许可证
特别感谢:
- Windsurf - 世界首个智能代理 IDE,使本项目的开发成为可能
- Claude 3.5 Sonnet - 在整个开发过程中提供全面的 AI 辅助