Index_guess_up_or_down_with_nn

有个猜涨跌的活动，在每天1点前预测当天上证指数的涨跌，刚好最近在学神经网络，因此就想训练模型验证一下相关性。

先说结论：分别使用MLP、RNN、GRU、LSTM、Transformer，在测试集上获得了81%的正确率，具体训练log在train_log.txt

这里主要介绍how to run，有关代码的运行结果可以看 https://www.zhihu.com/question/54542998/answer/3568996469

运行

运行环境

Python 3.10.1

数据集

链接: https://pan.baidu.com/s/1QlCrU89CsLDjSfSiX3gfmw 提取码: ce6v

然后修改 data_process.py 中的

pre_process_file_dir = "D:/data/stock_market/Index/"

为正确的路径

训练集： 720 个指数，时间跨度2004-06-13 -> 2024-05-01

测试集： 720 个指数，时间跨度2024-05-01-> 2024-06-14

评估集： sh000001, sz399808 指数，时间跨度 2024-05-01-> 2024-06-14，评估集较小，单纯用来看下实际性能

train

total_batch_size = 65536
batch_size = 65536
input_size = 121
hidden_size = 512
n_head = 2
output_size = 2
num_hidden_layers = 20
learning_rate = 2e-3
train_num_epochs = 10
max_load_data = 20000000
weight_decay_rate = 0.0
model_type = "MLP"  # MLP, MLP_Residual, MLP_Tanh, RNN, GRU, LSTM, Transformer
Data_norm_rate = 100000000.0
dummy_class = 0

可调的超参数如上，可忽略 MLP_Residual, MLP_Tanh 两个model

        for data, labels in train_loader:
            data, labels = data.to(device), labels.to(device)
        # prefetcher = my_data_process.data_prefetcher(train_loader)
        # data, labels = prefetcher.next()
        # while data is not None:
            # 前向传播
            with torch.no_grad():
                data = Data_norm_rate * (data / data[:, 0].unsqueeze(1) - 1)
             
            # 中间省略
            
            total_loss += loss.detach()
            # data, labels = prefetcher.next()

当前代码使用cpu训练会报错，需要修改 train.py 中的 train_loop 和 eval_model 两个函数，示例如上

reason

预测当天的指数涨跌类型

today 2024-07-21 is not TradeDay

如果是非工作日则不会运行

today = today - datetime.timedelta(days=2)

可以通过手动修改日期来测试

2024-07-19
0 26.45% 73.55% -0.08% True False
1 86.12% 13.88% 0.83% True True

字段含义是指数类别涨的概率跌的概率到当天中午的涨跌幅度预测的值是否和当前涨跌方向一致预测的值是否和真实值一致(如果是历史数据会有这一项)
0 1 分别由index_name_list = ["sh000001", "sz399808"] 定义

当前默认的模型 MLP_e_2_tiran_79.02_test_81.19_val_83.57_bs_65536_as_1.0_is_121_hs_512_nh_2_os_2_nhl_20_lr_0.002_wd_0.0_ds_20000000_model_weights.bin 的预测概率如下

可以看出预测的概率和真实概率在测试集上存在线性关系

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README		README
__pycache__		__pycache__
data		data
model		model
README.md		README.md
data_process.py		data_process.py
model.py		model.py
reasoning.py		reasoning.py
requirements.txt		requirements.txt
train.py		train.py
train_log.txt		train_log.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Index_guess_up_or_down_with_nn

运行

运行环境

数据集

train

reason

About

Releases

Packages

Languages

Llfeng18/Index_guess_up_or_down_with_nn

Folders and files

Latest commit

History

Repository files navigation

Index_guess_up_or_down_with_nn

运行

运行环境

数据集

train

reason

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages