课程来在七月在线的自动聊天机器人项目班
课程是2017年出来的,现在看除了一些基本的NLP理论知识,对机器人的理解和工业开发上已经有了很大的改变。
如果对NLP和聊天机器人感兴趣的同学可以可以看看本篇笔记,我会在后面加上一些现在比较前言的知识和实战。
- 主要内容:
- NLTK
- 语料库--corpus
- 文本处理流程
-
分词
- 简单分词--word_tokenize
- 中文分词--jieba
- 复杂分词,采用正则表达式预处理
-
归一化
- Steamming词干提取:把不影响词性的inflection的小尾巴砍掉
- 单词词性标注:nltk.pos_tag
- Lemmatization词形归一:把各种类型的词的变形,都归为一个形式
-
停止词
- 库:from nltk.corpus import stopwords
- stopwords列表:http://www.ranks.nl/stopwords
-
- NLP经典三个案例
- 情感分析
- 简单情感分析
- 搭配ML的情感分析
- 文本相似度
- 余弦定理
- Frequency词频统计
- nltk.FreDist
- 文本分类
- 情感分析
- gensim
- 深度学习加持
- Autoencoder
- Word2Vec
- NLTK
- 第二课PPT:点我
- 第二课代码和文档:点我
- 数据集:点我
- 主要内容
- 关于聊天机器人的思考
- 1.工程考量
- 2.机器学习角度考量
- 预备知识
- 1.检索与匹配
- 2.分类与朴素贝叶斯
- chatterbot
- 1.架构与使用方法
- 2.源码分析
- 3.用python,Django和Flask构造一个基于网页端的聊天机器人
- 关于聊天机器人的思考
- PPT:点我
- 代码和笔记:点我
- 主要内容
- 循环神经网络
- 1.场景与多种应用
- 2.NLP文字序列最爱的RNN
- 3.BPTT算法
- 4.利用Microsoft COCO数据集和pytorch实现看图说话
- LSTM
- 1.长时依赖问题
- 2.记忆细胞与状态
- NLP中的应用
- 1.各式各样的生成模型
- RNN生成模仿仿照维基百科
- RNN生成模型写食谱
- 模仿奥巴马演讲
- 2.看图说话基础版与高级版
- 3.序列到序列学习(机器翻译等)
- 1.各式各样的生成模型
- 循环神经网络
- 代码和文档:点我
- 主要内容
- 更聪明的聊天机器人
- 1.生成式模型 VS 检索匹配模型
- 2.Chatterbot的进化:深度学习提高智能度
- 模型构建
- 1.问题的分析与转化
- 2.数据集与样本构造方法
- 3.模型结构的构建
- 4.模型的评估
- 5.代码实现与解析
- PPT:点我
- 代码和笔记:点我
- 代码和笔记:点我
- PPT:点我