-
Notifications
You must be signed in to change notification settings - Fork 59
بهبود کیفیت
reza1615 edited this page Nov 5, 2012
·
1 revision
برای بهبود کیفیت کارهای زیر را باید انجام داد
۱-ساخت فایلهای http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3#Dictionary_Data_(Optional) که در اینجا فایل اصلی و کامپایل شده موجود است توجه داشته باشید که برای هر per.unicharset که درست کردید آن را در فولدر کپی کنید و یک بار باید فایل run wordlist.bat (موجود در فولدر ذکر شده) را اجرا نمائید و نتیجهاش فایلهایی با پسوند -dawg میشود که در زمان ساخت datatraining باید در کنار بقیه فایلها باشند.
۲-افزایش واژگان و باکس (به کمک نسخهٔ سرور محلی جعبهساز که راهنمای استفادهاش در فایل readme.txt موجود است)
۳- http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3#The_last_file_(unicharambigs) که نمونهاش در اینجا موجود است
۴-استفاده از متون متفاوت با موضوعهای متفاوت.