Skip to content

A lightweight, customizable voice-to-text application using Google and Vosk speech recognition models. Automatically synchronizes with Windows keyboard layout for multilingual support.

License

Notifications You must be signed in to change notification settings

mostafaafrouzi/Voice-to-Text-Windows

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

تبدیل گفتار به متن

برنامه‌ای مدرن و سبک برای تبدیل گفتار به متن با استفاده از مدل‌های تشخیص گفتار Google و Vosk. این برنامه به‌طور خودکار با چیدمان کیبورد ویندوز هماهنگ شده و از چندین زبان پشتیبانی می‌کند.


امکانات

  • تبدیل گفتار به متن به صورت لحظه‌ای
  • پشتیبانی از مدل‌های مختلف: Google و Vosk
  • هماهنگی خودکار زبان با چیدمان کیبورد ویندوز
  • تنظیمات قابل سفارشی‌سازی برای انتخاب زبان و مدل
  • میانبر کیبورد جهانی: Ctrl + Alt + V برای فعال یا غیرفعال کردن میکروفون
  • ایجاد لاگ برای اشکال‌زدایی

نصب

پیش‌نیازها

  • پایتون نسخه 3.9 یا بالاتر
  • اطمینان از نصب pip برای مدیریت وابستگی‌ها
  • یک میکروفون فعال

مراحل

git clone https://github.com/your-username/voice-to-text.git
cd voice-to-text
pip install -r requirements.txt
python voice_to_text.py

استفاده

اجرای برنامه

  1. فایل voice_to_text.py را اجرا کنید.
  2. از دکمه 🎤 برای روشن یا خاموش کردن میکروفون استفاده کنید.
  3. یا با فشار دادن Ctrl + Alt + V گفتار به متن را شروع یا متوقف کنید.

تنظیمات

  • شما می‌توانید:
    • زبان تشخیص گفتار را انتخاب کنید (به صورت خودکار با چیدمان کیبورد ویندوز هماهنگ می‌شود).
    • بین مدل‌های Google (آنلاین) و Vosk (آفلاین) جابه‌جا شوید.

میانبرها

  • Ctrl + Alt + V: شروع یا توقف تبدیل گفتار به متن.

اشکال‌زدایی

  • لاگ‌ها در فایل debug_log.txt در دایرکتوری برنامه ذخیره می‌شوند.

مشارکت

لطفاً مخزن را فورک کنید، ویژگی‌های جدید اضافه کنید یا باگ‌ها را رفع کنید. درخواست‌های Pull مورد استقبال قرار می‌گیرند!


مجوز

این پروژه تحت مجوز MIT منتشر شده است.


وابستگی‌ها

کتابخانه‌های پایتون زیر برای اجرای این پروژه موردنیاز هستند:

  • speechrecognition
  • vosk
  • pynput
  • tk
  • pyaudio
  • pywin32

آن‌ها را با دستور زیر نصب کنید:

pip install -r requirements.txt

نکات

- **مدل Vosk**: اطمینان حاصل کنید که مدل Vosk را دانلود کرده و در دایرکتوری پروژه قرار دهید.
- **دسترسی‌ها**: برخی از ویژگی‌ها ممکن است به دسترسی‌های مدیریتی نیاز داشته باشند.
- **زبان‌های پشتیبانی‌شده**: Google Speech Recognition از چندین زبان پشتیبانی می‌کند و زبان به صورت خودکار با چیدمان کیبورد ویندوز هماهنگ می‌شود.

About

A lightweight, customizable voice-to-text application using Google and Vosk speech recognition models. Automatically synchronizes with Windows keyboard layout for multilingual support.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages