Sniper

写在前面

由于苏神开发的bert4keras并没有什么文档，苏神本人的文档写了个头就没动过了，取而代之的是很多例子。

这对框架的使用者造成了一定的困扰，事实上我在初识bert4keras时，因为没文档，一度选择了学习transformers，当然transformers是一个很好的框架，但是对于学习的人来说，并没有bert4keras来的实在，毕竟有苏神在带着。

本文主要为我在阅读和使用bert4keras源码时的思考，和使用方法一并写下（试图）作为一版文档吧。

因此，其实本仓库并不能称作完整的文档，其实是一个笔记，争取把用法和代码讲明白（我也能力有限，只能把我用过的和我学过的部分进行说明）。

已经做了transformers的contributor努力做bert4keras的哈哈哈哈。

本文可能会照搬很多苏神的文字和代码，如果苏神介意我就取消开源

快速开始

下面是一个调用bert base模型来编码句子的简单例子：

from bert4keras.models import build_transformer_model
from bert4keras.tokenizers import Tokenizer
import numpy as np

config_path = '/root/kg/bert/chinese_L-12_H-768_A-12/bert_config.json'
checkpoint_path = '/root/kg/bert/chinese_L-12_H-768_A-12/bert_model.ckpt'
dict_path = '/root/kg/bert/chinese_L-12_H-768_A-12/vocab.txt'

tokenizer = Tokenizer(dict_path, do_lower_case=True)  # 建立分词器
model = build_transformer_model(config_path, checkpoint_path)  # 建立模型，加载权重

# 编码测试
token_ids, segment_ids = tokenizer.encode(u'语言模型')

print('\n ===== predicting =====\n')
print(model.predict([np.array([token_ids]), np.array([segment_ids])]))

其他库

其他库详见文件列表。分别对应了bert4keras的几大文件。

Name		Name	Last commit message	Last commit date
Latest commit History 55 Commits
backend		backend
imgs		imgs
layers		layers
models		models
optimizers		optimizers
snippets		snippets
tokenizers		tokenizers
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Sniper

写在前面

快速开始

其他库

About

Releases

Packages

Sniper970119/bert4keras_document

Folders and files

Latest commit

History

Repository files navigation

Sniper

写在前面

快速开始

其他库

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages