hparams.py

import argparse


class Hparams:
    parser = argparse.ArgumentParser()

    # prepro
    parser.add_argument('--vocab_size', default=38370, type=int)
    # 

    # train
    ## files
    parser.add_argument('--train1', default='data/train_src.txt',
                             help="german training segmented data")
    parser.add_argument('--train2', default='data/train_tgt.txt',
                             help="english training segmented data")
    parser.add_argument('--eval1', default='data/valid_src.txt',
                             help="german evaluation segmented data")
    parser.add_argument('--eval2', default='data/valid_tgt.txt',
                             help="english evaluation segmented data")
    #parser.add_argument('--eval3', default='iwslt2016/prepro/eval.en',
    #                         help="english evaluation unsegmented data")

    ## vocabulary path
    parser.add_argument('--vocab', default='data/word_dict_zhihu.npy',
                        help="vocabulary file path")

    # training scheme
    parser.add_argument('--batch_size', default=64, type=int)
    parser.add_argument('--eval_batch_size', default=64, type=int)


    parser.add_argument('--lr', default=0.001, type=float, help="learning rate")
    parser.add_argument('--warmup_steps', default=4000, type=int)#大概10个epoch
    parser.add_argument('--logdir', default="log/1", help="log directory")
    parser.add_argument('--num_epochs', default=150, type=int)
    parser.add_argument('--evaldir', default="eval/1", help="evaluation dir")

    # model
    parser.add_argument('--d_model', default=512, type=int,
                        help="hidden dimension of encoder/decoder")
    parser.add_argument('--d_ff', default=1024,type=int,
                        help="hidden dimension of feedforward layer")
    parser.add_argument('--num_blocks', default=3, type=int,
                        help="number of encoder/decoder blocks")
    parser.add_argument('--num_heads', default=4, type=int,
                        help="number of attention heads")
    parser.add_argument('--maxlen1', default=6, type=int,
                        help="maximum length of a source sequence")
    #源语句的最大长度
    parser.add_argument('--maxlen2', default=101, type=int,
                        help="maximum length of a target sequence")
    #目标语句的最大长度
    parser.add_argument('--dropout_rate', default=0.3, type=float)
    parser.add_argument('--smoothing', default=0.1, type=float,
                        help="label smoothing rate")

    # test
    parser.add_argument('--test1', default='data/test_src.txt',
                        help="german test segmented data")
    parser.add_argument('--test2', default='data/test_tgt.txt',
                        help="english test data")
    parser.add_argument('--ckpt',  default='log/1', help="checkpoint file path")
    parser.add_argument('--test_batch_size', default=64, type=int)
    parser.add_argument('--testdir', default="test/1", help="test result dir")
    
"""
class Hparams:
    parser = argparse.ArgumentParser()

    # prepro
    parser.add_argument('--vocab_size', default=32000, type=int)
    # 

    # train
    ## files
    parser.add_argument('--train1', default='data/train_src.txt',
                             help="german training segmented data")
    parser.add_argument('--train2', default='data/train_tgt.txt',
                             help="english training segmented data")
    parser.add_argument('--eval1', default='data/valid_src.txt',
                             help="german evaluation segmented data")
    parser.add_argument('--eval2', default='data/valid_tgt.txt',
                             help="english evaluation segmented data")
    #parser.add_argument('--eval3', default='iwslt2016/prepro/eval.en',
    #                         help="english evaluation unsegmented data")

    ## vocabulary path
    parser.add_argument('--vocab', default='data/word_dict_zhihu.npy',
                        help="vocabulary file path")

    # training scheme
    parser.add_argument('--batch_size', default=64, type=int)
    parser.add_argument('--eval_batch_size', default=64, type=int)


    parser.add_argument('--lr', default=0.0003, type=float, help="learning rate")
    parser.add_argument('--warmup_steps', default=4000, type=int)
    parser.add_argument('--logdir', default="log/1", help="log directory")
    parser.add_argument('--num_epochs', default=20, type=int)
    parser.add_argument('--evaldir', default="eval/1", help="evaluation dir")

    # model
    parser.add_argument('--d_model', default=512, type=int,
                        help="hidden dimension of encoder/decoder")
    parser.add_argument('--d_ff', default=2048, type=int,
                        help="hidden dimension of feedforward layer")
    parser.add_argument('--num_blocks', default=6, type=int,
                        help="number of encoder/decoder blocks")
    parser.add_argument('--num_heads', default=8, type=int,
                        help="number of attention heads")
    parser.add_argument('--maxlen1', default=5, type=int,
                        help="maximum length of a source sequence")
    #源语句的最大长度
    parser.add_argument('--maxlen2', default=100, type=int,
                        help="maximum length of a target sequence")
    #目标语句的最大长度
    parser.add_argument('--dropout_rate', default=0.3, type=float)
    parser.add_argument('--smoothing', default=0.1, type=float,
                        help="label smoothing rate")

    # test
    parser.add_argument('--test1', default='data/test_src.txt',
                        help="german test segmented data")
    parser.add_argument('--test2', default='data/test_tgt.txt',
                        help="english test data")
    parser.add_argument('--ckpt', help="checkpoint file path")
    parser.add_argument('--test_batch_size', default=128, type=int)
    parser.add_argument('--testdir', default="test/1", help="test result dir")
"""