Code của tôi theo cuốn sách "Khoa học dữ liệu trong lĩnh vực Tài chính - Ngân hàng". Nếu bạn muốn thực hành và kiểm chứng, hãy làm theo hưỡng dẫn bên dưới.
- Python >= 3.8
- Git
- Clone repository:
git clone https://github.com/lktuan/ds4fb.git
cd ds4fb
- Tạo và kích hoạt môi trường ảo:
python -m venv .venv
# Windows:
.venv\Scripts\activate
# Linux/Mac:
source .venv/bin/activate
- Cài đặt project và dependencies:
# Cài đặt các dependencies
pip install -r requirements.txt
# # Cài đặt Jupyter Notebook extensions để format code trực tiếp trong notebook
# pip install jupyter_contrib_nbextensions
# jupyter contrib nbextension install --user
- Thiết lập pre-commit hooks:
pre-commit install
- Đăng ký Kernel của
.venv
cho Jupyter nếu chưa có
python -m ipykernel install --user --name=ds4fb
- Tạo data
credit dataset
python .\data\generator\credit_data_gen.py
Project này sử dụng:
- black cho code formatting
- isort cho import sorting
- flake8 cho code linting
Các tools này được tự động chạy thông qua pre-commit hooks mỗi khi commit.
Để chạy format manually:
# Format toàn bộ project
black .
isort .
# Kiểm tra lỗi
flake8
- pandas >= 2.2.0
- numpy >= 1.26.0
- scikit-learn >= 1.4.0
- scipy >= 1.12.0
- statsmodels >= 0.14.1
- pytorch >= 2.2.0
- tensorflow >= 2.15.0