Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

ViT Bサイズの学習 #9

Open
SakodaShintaro opened this issue May 15, 2022 · 0 comments
Open

ViT Bサイズの学習 #9

SakodaShintaro opened this issue May 15, 2022 · 0 comments

Comments

@SakodaShintaro
Copy link
Owner

SakodaShintaro commented May 15, 2022

実験目的

ViTのサイズSとサイズBで性能に差が出るか確認する。

サイズS : 12ブロック 384ch パラメータ数 21,371,598
サイズB : 12ブロック 768ch パラメータ数 85,210,446

実験条件

学習にはdlshogi_with_gct-***.hcpeを使用
検証にはfloodgate_2019-2021_r3500-001.hcpeを使用

項目
学習ステップ数 60K
base_learn_rate 0.01
weight_decay 0.0001
batch_size 256

実験結果

Policy損失

compare_valid_policy_loss

Value損失

compare_valid_value_loss

結論

サイズBの方が良い性能になった。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
Development

No branches or pull requests

1 participant