[BUG] 使用微调后的模型，项目启动报错 #2023

ryancurry-mz · 2023-10-30T07:04:48Z

ryancurry-mz
Oct 30, 2023

问题描述 / Problem Description
我利用qwen-7b-chat-Int4模型基于自己的语料进行qlora微调，效果还可以。但是用本项目用peft方式加载，项目启动报错。采用的方式是lora+原模型，请问是有哪里没有修改吗？请大佬指点

复现问题的步骤 / Steps to Reproduce
按照wiki的提供的方式操作：
1、将config.json文件修改为adapter_config.json;
2、保证文件夹包含pytorch_model.bin文件；
3、修改文件夹名称，保证文件夹包含'peft'一词；
4、将peft文件夹移入项目目录下；
5、确保adapter_config.json文件夹中base_model_name_or_path指向基础模型；
6、将peft路径添加到model_config.py的llm_dict中，键为模型名，值为peft路径；
7、开启 PEFT_SHARE_BASE_WEIGHTS=true环境变量，再执行python startup.py -a

预期的结果 / Expected Result
项目正常启动

实际结果 / Actual Result
项目启动报错

环境信息 / Environment Information

langchain-ChatGLM 版本/commit 号：v2.0.5
是否使用 Docker 部署（是/否）：否
使用的模型（ChatGLM2-6B / Qwen-7B 等）：Qwen-7B-Chat-Int4
使用的 Embedding 模型（moka-ai/m3e-base 等）：moka-ai/m3e-base
使用的向量库类型 (faiss / milvus / pg_vector 等)： faiss
操作系统及版本 / Operating system and version: wsl2 Ubuntu20.04
Python 版本 / Python version:3.10.9
其他相关环境信息 / Other relevant environment information:

附加信息 / Additional Information

adapter_config.json内容如下：
{
"auto_mapping": null,
"base_model_name_or_path": "/data/Qwen-Repo/Qwen/model/Qwen-7B-Chat-Int4",
"bias": "none",
"fan_in_fan_out": false,
"inference_mode": true,
"init_lora_weights": true,
"layers_pattern": null,
"layers_to_transform": null,
"lora_alpha": 16,
"lora_dropout": 0.05,
"modules_to_save": null,
"peft_type": "LORA",
"r": 64,
"revision": null,
"target_modules": [
"c_attn",
"c_proj",
"w1",
"w2"
],
"task_type": "CAUSAL_LM"
}

yaospacetim · 2023-10-30T09:20:15Z

yaospacetim
Oct 30, 2023

项目中调用模型，必须和他们预设的官方文件夹名字一致

0 replies

ryancurry-mz · 2023-10-30T09:28:56Z

ryancurry-mz
Oct 30, 2023
Author

项目中调用模型，必须和他们预设的官方文件夹名字一致

感谢答复。可以举个例子么？模型名我没有改，只改动了lora路径

0 replies

ryancurry-mz · 2023-10-31T02:44:49Z

ryancurry-mz
Oct 31, 2023
Author

我的理解是，在model_config.py的llm_model中指定lora权重的路径，并在adapter_config.json中base_model_name_or_path指向基础模型。目的是使用lora权重文件+原模型。不知道这个思路有没有问题

0 replies

yaospacetim · 2023-10-31T12:39:43Z

yaospacetim
Oct 31, 2023

我是按照他们的文档弄的，加载是没问题了，但是加载后其实有问题，回答变得不可控了，问了一圈，有很多人也存在这个情况，没人提出解决方案，我也放弃了。

0 replies

GAllllong · 2023-11-01T01:42:37Z

GAllllong
Nov 1, 2023

我也一直在尝试使用ptuning微调后的chatglm2-6b模型，按照项目给的操作方式操作后始终卡在这一步，没有跑起来，有朋友们遇到过图中这种错误嘛，求指点一下。

0 replies

zzy978 · 2023-11-06T10:38:44Z

zzy978
Nov 6, 2023

我的理解是，在model_config.py的llm_model中指定lora权重的路径，并在adapter_config.json中base_model_name_or_path指向基础模型。目的是使用lora权重文件+原模型。不知道这个思路有没有问题

大佬现在运行出来了嘛，能不能正常使用啊？

0 replies

ryancurry-mz · 2023-11-07T01:40:09Z

ryancurry-mz
Nov 7, 2023
Author

我的理解是，在model_config.py的llm_model中指定lora权重的路径，并在adapter_config.json中base_model_name_or_path指向基础模型。目的是使用lora权重文件+原模型。不知道这个思路有没有问题

大佬现在运行出来了嘛，能不能正常使用啊？

没有，这个问题还没解决。有思路可以讨论讨论

0 replies

zzy978 · 2023-11-07T03:37:56Z

zzy978
Nov 7, 2023

加个联系方式讨论一下嘛，我的QQ是2727408974

…

---原始邮件--- 发件人: ***@***.***> 发送时间: 2023年11月7日(周二) 上午9:40 收件人: ***@***.***>; 抄送: ***@***.******@***.***>; 主题: Re: [chatchat-space/Langchain-Chatchat] [BUG] 使用微调后的模型，项目启动报错 (Issue #1920) 我的理解是，在model_config.py的llm_model中指定lora权重的路径，并在adapter_config.json中base_model_name_or_path指向基础模型。目的是使用lora权重文件+原模型。不知道这个思路有没有问题大佬现在运行出来了嘛，能不能正常使用啊？没有，这个问题还没解决。有思路可以讨论讨论 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: ***@***.***>

0 replies

zRzRzRzRzRzRzR · 2023-11-10T01:42:29Z

zRzRzRzRzRzRzR
Nov 10, 2023
Collaborator

现在正常吗，尝试导出成完整模型，然后读入完整模型呢

0 replies

zzy978 · 2023-11-10T01:57:19Z

zzy978
Nov 10, 2023

我是导出的完整模型

…

---原始邮件--- 发件人: ***@***.***> 发送时间: 2023年11月10日(周五) 上午9:42 收件人: ***@***.***>; 抄送: ***@***.******@***.***>; 主题: Re: [chatchat-space/Langchain-Chatchat] [BUG] 使用微调后的模型，项目启动报错 (Issue #1920) 现在正常吗，尝试导出成完整模型，然后读入完整模型呢 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: ***@***.***>

0 replies

ryancurry-mz · 2023-11-10T06:19:05Z

ryancurry-mz
Nov 10, 2023
Author

现在正常吗，尝试导出成完整模型，然后读入完整模型呢

启动不报错了。我之前按照wiki将权重文件改成pytorch_model.bin，现在改adapter_model.bin就可以了。

另外，qlora微调的权重文件没法合并到原模型里面。所以没办法用完整模型的方式去加载。lora可以。

2 replies

misAdann Dec 7, 2023

你好，我这样加载可以启动，但还是会乱答。请问你有这种情况吗？

ryancurry-mz Dec 7, 2023
Author

有时候会乱答，大概率是微调的原因。

yaospacetim · 2023-11-10T15:20:44Z

yaospacetim
Nov 10, 2023

谢谢，还没试，晚一点试一下  yaospacetim ***@***.***  

…

------------------ 原始邮件 ------------------ 发件人: ***@***.***>; 发送时间: 2023年11月10日(星期五) 下午2:19 收件人: ***@***.***>; 抄送: ***@***.***>; ***@***.***>; 主题: Re: [chatchat-space/Langchain-Chatchat] [BUG] 使用微调后的模型，项目启动报错 (Issue #1920) 现在正常吗，尝试导出成完整模型，然后读入完整模型呢启动不报错了。我之前按照wiki改成将bin文件改成pytorch_model.bin，现在改adapter_model.bin就可以了。另外，qlora微调的权重文件没法合并到原模型里面。 — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: ***@***.***>

0 replies

zRzRzRzRzRzRzR · 2023-11-11T06:53:28Z

zRzRzRzRzRzRzR
Nov 11, 2023
Collaborator

qlora不行 qlora需要merge到大模型才行

1 reply

ryancurry-mz Nov 13, 2023
Author

大佬，这是qwen官方文档微调部分的描述，其中说qlora好像没法merge到大模型中。实际上是可以merge的么

zRzRzRzRzRzRzR · 2023-11-12T11:51:07Z

zRzRzRzRzRzRzR
Nov 12, 2023
Collaborator

感觉这个问题是一个值得讨论的问题，我将其放到Discussion，因为不同人的效果确实有不同差异

0 replies

moilxyyyyy · 2023-11-30T13:48:30Z

moilxyyyyy
Nov 30, 2023

开启 PEFT_SHARE_BASE_WEIGHTS=true环境变量

你好，请问这个参数在哪里呢，找了一圈没找到（lora+原模型）

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[BUG] 使用微调后的模型，项目启动报错 #2023

{{title}}

{{editor}}'s edit

{{editor}}'s edit

Replies: 15 comments 3 replies

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

Select a reply

[BUG] 使用微调后的模型，项目启动报错 #2023

Replies: 15 comments · 3 replies

ryancurry-mz Oct 30, 2023 Author

ryancurry-mz Oct 31, 2023 Author

ryancurry-mz Nov 7, 2023 Author

zRzRzRzRzRzRzR Nov 10, 2023 Collaborator

ryancurry-mz Nov 10, 2023 Author

ryancurry-mz Dec 7, 2023 Author

zRzRzRzRzRzRzR Nov 11, 2023 Collaborator

ryancurry-mz Nov 13, 2023 Author

zRzRzRzRzRzRzR Nov 12, 2023 Collaborator

Replies: 15 comments 3 replies

ryancurry-mz
Oct 30, 2023
Author

ryancurry-mz
Oct 31, 2023
Author

ryancurry-mz
Nov 7, 2023
Author

zRzRzRzRzRzRzR
Nov 10, 2023
Collaborator

ryancurry-mz
Nov 10, 2023
Author

ryancurry-mz Dec 7, 2023
Author

zRzRzRzRzRzRzR
Nov 11, 2023
Collaborator

ryancurry-mz Nov 13, 2023
Author

zRzRzRzRzRzRzR
Nov 12, 2023
Collaborator