Skip to content

tie_word_embeddings为true的模型,LoRA 微调,additional_target只学习 embed_tokens 时,推理时能够输出新添加的特殊 Token,但同时学习 embed_tokens 和 lm_head 后则不会 #1899

tie_word_embeddings为true的模型,LoRA 微调,additional_target只学习 embed_tokens 时,推理时能够输出新添加的特殊 Token,但同时学习 embed_tokens 和 lm_head 后则不会

tie_word_embeddings为true的模型,LoRA 微调,additional_target只学习 embed_tokens 时,推理时能够输出新添加的特殊 Token,但同时学习 embed_tokens 和 lm_head 后则不会 #1899

Workflow file for this run

name: label_issue
on:
issues:
types:
- opened
jobs:
label_issue:
runs-on: ubuntu-latest
permissions:
issues: write
steps:
- env:
GH_TOKEN: ${{ secrets.GITHUB_TOKEN }}
ISSUE_URL: ${{ github.event.issue.html_url }}
ISSUE_TITLE: ${{ github.event.issue.title }}
run: |
LABEL=pending
NPU_KEYWORDS=(npu huawei ascend 华为 昇腾)
ISSUE_TITLE_LOWER=$(echo $ISSUE_TITLE | tr '[:upper:]' '[:lower:]')
for KEYWORD in ${NPU_KEYWORDS[@]}; do
if [[ $ISSUE_TITLE_LOWER == *$KEYWORD* ]] && [[ $ISSUE_TITLE_LOWER != *input* ]]; then
LABEL=pending,npu
break
fi
done
gh issue edit $ISSUE_URL --add-label $LABEL