Skip to content

بهبود کیفیت

reza1615 edited this page Nov 5, 2012 · 1 revision
برای بهبود کیفیت کارهای زیر را باید انجام داد

۱-ساخت فایل‌های http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3#Dictionary_Data_(Optional) که در اینجا فایل اصلی و کامپایل شده موجود است توجه داشته باشید که برای هر per.unicharset که درست کردید آن را در فولدر کپی کنید و یک بار باید فایل run wordlist.bat (موجود در فولدر ذکر شده) را اجرا نمائید و نتیجه‌اش فایل‌هایی با پسوند -dawg می‌شود که در زمان ساخت datatraining باید در کنار بقیه فایل‌ها باشند.

۲-افزایش واژگان و باکس (به کمک نسخهٔ سرور محلی جعبه‌ساز که راهنمای استفاده‌اش در فایل readme.txt موجود است)

۳- http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3#The_last_file_(unicharambigs) که نمونه‌اش در اینجا موجود است

۴-استفاده از متون متفاوت با موضوع‌های متفاوت.