برنامهای مدرن و سبک برای تبدیل گفتار به متن با استفاده از مدلهای تشخیص گفتار Google و Vosk. این برنامه بهطور خودکار با چیدمان کیبورد ویندوز هماهنگ شده و از چندین زبان پشتیبانی میکند.
- تبدیل گفتار به متن به صورت لحظهای
- پشتیبانی از مدلهای مختلف: Google و Vosk
- هماهنگی خودکار زبان با چیدمان کیبورد ویندوز
- تنظیمات قابل سفارشیسازی برای انتخاب زبان و مدل
- میانبر کیبورد جهانی:
Ctrl + Alt + V
برای فعال یا غیرفعال کردن میکروفون - ایجاد لاگ برای اشکالزدایی
- پایتون نسخه 3.9 یا بالاتر
- اطمینان از نصب
pip
برای مدیریت وابستگیها - یک میکروفون فعال
git clone https://github.com/your-username/voice-to-text.git
cd voice-to-text
pip install -r requirements.txt
python voice_to_text.py
- فایل
voice_to_text.py
را اجرا کنید. - از دکمه 🎤 برای روشن یا خاموش کردن میکروفون استفاده کنید.
- یا با فشار دادن
Ctrl + Alt + V
گفتار به متن را شروع یا متوقف کنید.
- شما میتوانید:
- زبان تشخیص گفتار را انتخاب کنید (به صورت خودکار با چیدمان کیبورد ویندوز هماهنگ میشود).
- بین مدلهای Google (آنلاین) و Vosk (آفلاین) جابهجا شوید.
Ctrl + Alt + V
: شروع یا توقف تبدیل گفتار به متن.
- لاگها در فایل
debug_log.txt
در دایرکتوری برنامه ذخیره میشوند.
لطفاً مخزن را فورک کنید، ویژگیهای جدید اضافه کنید یا باگها را رفع کنید. درخواستهای Pull مورد استقبال قرار میگیرند!
این پروژه تحت مجوز MIT منتشر شده است.
کتابخانههای پایتون زیر برای اجرای این پروژه موردنیاز هستند:
speechrecognition
vosk
pynput
tk
pyaudio
pywin32
آنها را با دستور زیر نصب کنید:
pip install -r requirements.txt
- **مدل Vosk**: اطمینان حاصل کنید که مدل Vosk را دانلود کرده و در دایرکتوری پروژه قرار دهید.
- **دسترسیها**: برخی از ویژگیها ممکن است به دسترسیهای مدیریتی نیاز داشته باشند.
- **زبانهای پشتیبانیشده**: Google Speech Recognition از چندین زبان پشتیبانی میکند و زبان به صورت خودکار با چیدمان کیبورد ویندوز هماهنگ میشود.