Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

几百张训练图片肯定不够吧? #69

Open
chenxs1427 opened this issue Oct 27, 2024 · 3 comments
Open

几百张训练图片肯定不够吧? #69

chenxs1427 opened this issue Oct 27, 2024 · 3 comments

Comments

@chenxs1427
Copy link

在参考训练资料里面,我看了bubbl原作者的博客,每个字符至少要标注20张 😅

@ghost
Copy link

ghost commented Oct 27, 2024

在参考训练资料里面,我看了bubbl原作者的博客,每个字符至少要标注20张 😅

我用程序标注了2000多张正确的验证码,用错误验证码当验证集,效果还可以,但是我不知道怎么使用模型

@MgArcher
Copy link
Owner

MgArcher commented Oct 28, 2024 via email

@ghost
Copy link

ghost commented Oct 31, 2024

转onnx后直接使用即可

---- 回复的原邮件 ---- | 发件人 | @.> | | 日期 | 2024年10月27日 17:43 | | 收件人 | @.> | | 抄送至 | @.> | | 主题 | Re: [MgArcher/Text_select_captcha] 几百张训练图片肯定不够吧? (Issue #69) | 在参考训练资料里面,我看了bubbl原作者的博客,每个字符至少要标注20张 😅 我用程序标注了2000多张正确的验证码,用错误验证码当验证集,效果还可以,但是我不知道怎么使用模型 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.>

万分感谢您,用volov5官方自带的导出脚本,边长设置384,导出后报错边长640,改配置为640后重试,代码未报错,但无识别结果,尝试按照我的训练配置更改char和target的顺序,成功识别。

数据集来源为程序自动抓取的验证码,并配合孪生模型自动标记,好像是2700张左右,验证集为手动标注的10张易错验证码,也是程序自动抓取的,实测您的yolo+孪生v6模型抓到的成功验证码和失败验证码的比率为498:408。

之前抓取2700张验证码的代码有问题,里面大部分验证码是无法正确识别的,相当于给模型喂了错误数据。全靠10张验证集来矫正。epoch设置的100000,速度调的自动,结果用kaggle跑到500epoch时由于没有进步训练自动暂停了,自动保存的最老的模型就是500epoch。

接下来打算抓一些能够成功识别的验证码重新训练试试,应该识别准确率还能提升

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants