MiLu-GPT

基于GPT2+BERT的语言模型，以少量的纯中文语料从头训练，验证小模型在ChatGPT类似友好能力

GPT2+BERTokenizer从头训练模型（50W闲聊等语料）

环境：
WIN10+Torch1.31+Cuda11.6
transformer4.29

主要代码说明：
generate_dialogue_subset.py：产生小的子数据集
preprocess.py：将txt格式数据集作序列化，得到pkl格式数据集
train.py：从头训练模型
interact.py: 使用从头训练模型给出回复
gptbot.py：给出一个对话机器人
generatedialogpt2.py：几种基于指令式或非指令式的回复格式

HF开源地址：https://huggingface.co/StarRing2022/MiLu-GPT/

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
config		config
data		data
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
generate_dialogue_subset.py		generate_dialogue_subset.py
generatedialogpt2.py		generatedialogpt2.py
gptbot.py		gptbot.py
interact.py		interact.py
preprocess.py		preprocess.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MiLu-GPT

About

Releases

Packages

Languages

License

StarRing2022/MiLu-GPT

Folders and files

Latest commit

History

Repository files navigation

MiLu-GPT

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages