Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

更新 #3

Open
wants to merge 488 commits into
base: master
Choose a base branch
from
Open
Show file tree
Hide file tree
Changes from all commits
Commits
Show all changes
488 commits
Select commit Hold shift + click to select a range
f47ee55
【add】my_tensorflow
imhuay Aug 12, 2018
aef4fac
【add】my_tensorflow
imhuay Aug 12, 2018
35bacaf
【add】my_tensorflow
imhuay Aug 12, 2018
a0f4957
结构调整
imhuay Aug 12, 2018
a419b69
结构调整
imhuay Aug 12, 2018
50048a4
结构调整
imhuay Aug 12, 2018
6bdde58
update
imhuay Aug 12, 2018
d72de44
【update】编辑距离
imhuay Aug 12, 2018
2a7d73d
update
imhuay Aug 13, 2018
412517b
【add】highway_dense-layer
imhuay Aug 13, 2018
08c1d35
结构调整
imhuay Aug 13, 2018
b30c7fe
update
imhuay Aug 13, 2018
35e1ece
【update】失效链接
imhuay Aug 13, 2018
0c19a00
update
imhuay Aug 13, 2018
e0931af
update
imhuay Aug 13, 2018
1cd3885
【update】不通过继承实现多态
imhuay Aug 13, 2018
07651ff
【add】倒排索引
imhuay Aug 13, 2018
07df6ff
update
imhuay Aug 13, 2018
1fbf637
【add】highway_conv2d-layer
imhuay Aug 13, 2018
a2ef999
update
imhuay Aug 14, 2018
3bd604c
【add】multi-highway-conv2d
imhuay Aug 14, 2018
db7ff5b
【add】备忘-Markdown小技巧
imhuay Aug 14, 2018
6daeb9b
【add】最长公共子序列
imhuay Aug 14, 2018
0fa2dd0
【add】attention for dense and rnn
imhuay Aug 14, 2018
46bc644
【add】attention_flow匹配层
imhuay Aug 14, 2018
59705c1
【add】动态规划-最长递增/上升子序列(LIS)
imhuay Aug 15, 2018
67e3b18
【update】动态规划-最长递增/上升子序列(LIS)
imhuay Aug 15, 2018
1732058
【update】动态规划-最长递增/上升子序列(LIS)
imhuay Aug 15, 2018
caaee9f
【update】动态规划-最长递增/上升子序列(LIS)
imhuay Aug 15, 2018
a84917e
【update】attention_flow匹配层
imhuay Aug 15, 2018
80fd801
【add】备忘-IPython小技巧
imhuay Aug 15, 2018
24bb92f
【update】attention_flow匹配层
imhuay Aug 15, 2018
7cee51c
【add】DP-最长回文子串/子序列
imhuay Aug 15, 2018
a08c411
【add】different ReLU
imhuay Aug 15, 2018
d6f90cd
【update】different ReLU
imhuay Aug 16, 2018
d3870a3
【add】最长公共字串
imhuay Aug 16, 2018
fe6f3ce
update
imhuay Aug 16, 2018
7681f2c
【update】动态规划
imhuay Aug 16, 2018
34f84cf
【update】DP-最长公共字串
imhuay Aug 16, 2018
bf1336f
【add】语义匹配模型
imhuay Aug 16, 2018
c9cb2d9
【add】专题-洗牌与采样算法
imhuay Aug 17, 2018
e596feb
【update】洗牌与采样
imhuay Aug 17, 2018
d8cb395
【update】洗牌与采样
imhuay Aug 17, 2018
9844a4a
update
imhuay Aug 17, 2018
3bb23b4
【update】移除IPython备忘,添加Python工具备忘
imhuay Aug 17, 2018
7315f26
【update】Python工具
imhuay Aug 17, 2018
95a7a19
【update】洗牌与采样
imhuay Aug 17, 2018
4c766e0
update
imhuay Aug 17, 2018
20d55ac
update
imhuay Aug 17, 2018
ac0750e
【update】偏差与方差
imhuay Aug 17, 2018
b08afe9
【update】生成模型与判别模型
imhuay Aug 17, 2018
38f9b7d
【update】生成模型与判别模型
imhuay Aug 17, 2018
cd9c3b2
【update】结构调整
imhuay Aug 18, 2018
1eb1e9b
update
imhuay Aug 18, 2018
98c576a
update
imhuay Aug 18, 2018
7286643
【update】LeetCode
imhuay Aug 19, 2018
da52387
【update】带权采样(有放回)
imhuay Aug 19, 2018
684644b
【update】带权采样(有放回)
imhuay Aug 19, 2018
542dbae
【add】DL-专题-优化算法
imhuay Aug 19, 2018
d83ea7a
【update】README
imhuay Aug 19, 2018
97e8256
Fix binary search bug (#9)
pjpjq Aug 19, 2018
9cea3e4
【fix】11. 旋转数组的最小数字
imhuay Aug 19, 2018
75af884
【update】DL-专题-优化算法
imhuay Aug 20, 2018
719075a
【add】阅读理解相关论文
imhuay Aug 20, 2018
24aeb63
【add】proj-完形填空
imhuay Aug 21, 2018
f202cf5
【update】双指针
imhuay Aug 21, 2018
16de6cb
【add】鹰蛋问题
imhuay Aug 21, 2018
eb7f8dc
【update】attention_flow 匹配层
imhuay Aug 21, 2018
b3d3b15
【update】DL-优化算法
imhuay Aug 21, 2018
428f36e
update
imhuay Aug 21, 2018
509116b
【update】完形填空-改进三
imhuay Aug 22, 2018
e22d110
【update】LeetCode题解
imhuay Aug 22, 2018
47412f9
【update】字节跳动812笔试
imhuay Aug 22, 2018
cd7bf98
【update】结构调整
imhuay Aug 22, 2018
1907114
【update】结构调整
imhuay Aug 22, 2018
9f27a5e
【update】随机数生成
imhuay Aug 22, 2018
18f9347
【update】DP-背包问题:01背包、完全背包
imhuay Aug 23, 2018
9849b5d
【update】2018-8-23
imhuay Aug 23, 2018
7e597b0
【update】CNN的内部实现、反向传播
imhuay Aug 24, 2018
1a8afc7
update
imhuay Aug 24, 2018
d2d0aad
【update】卷积的内部实现(Theano)
imhuay Aug 24, 2018
bb0f492
【update】词向量相关论文
imhuay Aug 24, 2018
b7aab8c
【update】重命名
imhuay Aug 25, 2018
72cf80d
【update】梯度下降及其改进(修订)
imhuay Aug 26, 2018
6a064c3
【update】深度学习中的优化算法(修订)
imhuay Aug 26, 2018
411009b
【add】K-Means
imhuay Aug 27, 2018
8a83c4f
【add】笔试-360-180827
imhuay Aug 27, 2018
d459c22
【update】360-第三题思路
imhuay Aug 27, 2018
9fbe39a
【update】K-Means完善注释
imhuay Aug 28, 2018
39f913e
【update】2018-8-27
imhuay Aug 28, 2018
2b2b5a4
【update】DL-专题-RNN
imhuay Aug 28, 2018
34e988d
【update】随机数-用rand_m()生成rand_n()
imhuay Aug 28, 2018
2370854
【update】DL-专题-CNN
imhuay Aug 28, 2018
ab59d9d
结构调整
imhuay Aug 28, 2018
714e580
【update】DL专题-RNN
imhuay Aug 29, 2018
213605c
【update】笔试-360-180827
imhuay Aug 29, 2018
d254027
结构调整
imhuay Aug 29, 2018
984ce67
结构调整
imhuay Aug 29, 2018
026987a
结构调整
imhuay Aug 29, 2018
768be8f
【update】RNN专题-RNN的3种设计模式
imhuay Aug 29, 2018
47c0ae7
【update】RNN的基本结构
imhuay Aug 29, 2018
6e4825a
【update】专题-Seq2Seq
imhuay Aug 29, 2018
3fdcceb
update
imhuay Aug 30, 2018
044a3cf
update
imhuay Aug 30, 2018
bd2437d
update
imhuay Aug 30, 2018
053ba84
【add】笔试-招行-180830
imhuay Aug 30, 2018
c366c3b
update
imhuay Aug 30, 2018
8a436af
update
imhuay Aug 30, 2018
ca6bcef
【add】DL基础-批归一化
imhuay Aug 31, 2018
9b445b1
update
imhuay Aug 31, 2018
3929403
【add】DP-最大正方形
imhuay Aug 31, 2018
07bed98
update
imhuay Aug 31, 2018
3555729
update
imhuay Sep 3, 2018
1fab512
update
imhuay Sep 3, 2018
607f335
fix #11 Lp范数公式
imhuay Sep 4, 2018
92d67db
update
imhuay Sep 4, 2018
9fcc097
update
imhuay Sep 4, 2018
6a06b0b
update
imhuay Sep 4, 2018
1774489
update
imhuay Sep 4, 2018
bce4555
update
imhuay Sep 4, 2018
a4decd6
【update】排列
imhuay Sep 4, 2018
d387940
【update】排列组合-第k个排列
imhuay Sep 5, 2018
8123178
【update】排列组合问题
imhuay Sep 5, 2018
b3fe7fb
结构调整
imhuay Sep 8, 2018
86f5326
结构调整
imhuay Sep 8, 2018
ae9e6d9
结构调整
imhuay Sep 8, 2018
e91746c
笔试-快手-180910
imhuay Sep 10, 2018
455028a
【update】快手第三题
imhuay Sep 10, 2018
e5b624c
【update】VQA综述
imhuay Sep 11, 2018
0df3ab3
【update】笔试-快手-180910-第三题
imhuay Sep 11, 2018
08e260b
【update】VQA综述
imhuay Sep 11, 2018
928c6cb
结构调整
imhuay Sep 12, 2018
152c933
结构调整
imhuay Sep 12, 2018
065ef9f
结构调整
imhuay Sep 12, 2018
9079c50
结构调整
imhuay Sep 12, 2018
e6ccbf5
【add】笔试-迅雷-180912
imhuay Sep 12, 2018
8f80df6
【add】笔试-百度-180911
imhuay Sep 12, 2018
01827ec
结构调整
imhuay Sep 12, 2018
b71abc5
【update】VQA综述
imhuay Sep 12, 2018
14fdcaf
【add】笔试-度小满-180913
imhuay Sep 13, 2018
8ccc7d1
结构调整
imhuay Sep 13, 2018
e5a95fd
【update】笔试-度小满-180913
imhuay Sep 13, 2018
8caa0c1
结构调整
imhuay Sep 13, 2018
bcfc1d8
结构调整
imhuay Sep 13, 2018
33e8a09
【add】算法-区间问题
imhuay Sep 13, 2018
5d008ab
结构调整
imhuay Sep 13, 2018
50a938a
结构调整
imhuay Sep 13, 2018
3f299ab
结构调整
imhuay Sep 13, 2018
0c8ef2b
结构调整
imhuay Sep 13, 2018
2d8912e
结构调整
imhuay Sep 13, 2018
fb4e861
结构调整
imhuay Sep 13, 2018
7613985
【add】专题-句向量
imhuay Sep 14, 2018
b6ef2d5
【add】笔试-百度-180914
imhuay Sep 14, 2018
69afb69
结构调整
imhuay Sep 15, 2018
f341572
【add】笔试-爱奇艺-180915
imhuay Sep 15, 2018
c6d596d
结构调整
imhuay Sep 15, 2018
5d74dbb
【update】专题-Sentence Embedding
imhuay Sep 15, 2018
5336720
【add】笔试-搜狐畅游-180915
imhuay Sep 15, 2018
1de5603
【update】专题-句向量
imhuay Sep 15, 2018
cd8949f
【add】笔试-腾讯-180916
imhuay Sep 16, 2018
30cb668
【update】笔试-腾讯-180916
imhuay Sep 16, 2018
2ec9aca
结构调整
imhuay Sep 16, 2018
c97229d
结构调整
imhuay Sep 16, 2018
6b6e70a
【update】笔试-腾讯-180916
imhuay Sep 16, 2018
7ee3d05
结构调整
imhuay Sep 16, 2018
d35ac93
【add】计算机视觉
imhuay Sep 17, 2018
865708d
【add】笔试-顺丰-180917
imhuay Sep 17, 2018
7719bda
【add】二维数组的二分查找
imhuay Sep 17, 2018
4e334cc
【add】笔试-滴滴-180918
imhuay Sep 18, 2018
21f930b
【update】动态规划-硬币问题
imhuay Sep 18, 2018
7f5cdb1
【update】笔试-滴滴-180918
imhuay Sep 18, 2018
5ae0701
【update】数据结构-二叉树的宽度
imhuay Sep 20, 2018
a201099
【add】Python中的垃圾回收机制
imhuay Sep 20, 2018
fb40972
结构调整
imhuay Sep 20, 2018
fb06238
结构调整
imhuay Sep 20, 2018
f5fb10a
【add】笔试-小米-180920
imhuay Sep 20, 2018
5c22019
【update】笔试-小米-180920(#12)
imhuay Sep 20, 2018
49e7742
【add】专题-双指针
imhuay Sep 21, 2018
95295e5
update
imhuay Sep 21, 2018
e2f0c37
【update】专题-双指针
imhuay Sep 21, 2018
f5e8fd1
【update】专题-双指针
imhuay Sep 23, 2018
82274e2
结构调整
imhuay Sep 24, 2018
9a9d91d
结构调整
imhuay Sep 24, 2018
cc15c1b
结构调整
imhuay Sep 24, 2018
26bca01
结构调整
imhuay Sep 24, 2018
20eaf96
结构调整
imhuay Sep 24, 2018
a3bba74
结构调整
imhuay Sep 24, 2018
0c9535f
结构调整
imhuay Sep 24, 2018
41e5332
update
imhuay Sep 24, 2018
6869776
update
imhuay Sep 24, 2018
20dd08a
【update】专题-双指针
imhuay Sep 24, 2018
45b6c76
update
imhuay Sep 25, 2018
2492f6b
update
imhuay Sep 25, 2018
4305860
【update】数据结构-LRU缓存
imhuay Sep 25, 2018
24ece44
update
imhuay Sep 25, 2018
517b3df
【update】专题-RNN
imhuay Sep 25, 2018
61d89cd
update
imhuay Sep 25, 2018
b569b0c
update
imhuay Sep 25, 2018
921ba21
update
imhuay Sep 25, 2018
0dc5d67
【add】笔试-作业帮-180925
imhuay Sep 25, 2018
3cccd79
【update】专题-双指针
imhuay Sep 25, 2018
821e62d
【update】专题-双指针
imhuay Sep 26, 2018
b10353b
【update】笔试-作业帮-180925
imhuay Sep 26, 2018
7b67776
【update】专题-双指针
imhuay Sep 26, 2018
9140e68
【add】笔试-iHandy-180927
imhuay Sep 27, 2018
cc806da
【update】笔试-iHandy-180927
imhuay Sep 27, 2018
b368802
【update】专题-双指针
imhuay Sep 27, 2018
f7a2e82
【update】专题-双指针(图示模板)
imhuay Sep 28, 2018
2903f10
update
imhuay Sep 28, 2018
4412e5a
【update】专题-双指针
imhuay Sep 28, 2018
b72aa02
Please merge to fix the wrong integral expression. (#16)
GinRyan Sep 29, 2018
d037bff
【update】链表快排
imhuay Sep 29, 2018
6d2057d
【update】链表排序
imhuay Sep 29, 2018
f44f883
【update】链表排序
imhuay Sep 29, 2018
c650b64
【update】链表排序
imhuay Sep 30, 2018
bf12765
update
imhuay Sep 30, 2018
4450e66
update
imhuay Oct 1, 2018
cd82c2e
update
imhuay Oct 1, 2018
8d24b3a
【add】概率
imhuay Oct 1, 2018
9877a66
feat: add OI Wiki (#18)
Ir1d Oct 6, 2018
08a2c0f
4.第四题区间最大最小值ljj个人解题思路 (#23)
Oct 12, 2018
97b5592
update
imhuay Oct 17, 2018
e2f8076
fix #25
imhuay Oct 18, 2018
5dd66d0
fix #25
imhuay Oct 18, 2018
1e59255
update
imhuay Oct 18, 2018
c25bc57
update
imhuay Oct 18, 2018
0a4e92e
update
imhuay Oct 18, 2018
8e7f23f
update
imhuay Oct 20, 2018
a65f96d
update
imhuay Oct 20, 2018
64efd5c
Update B-自然语言处理/D-视觉问答-1_综述.md
imhuay Oct 20, 2018
5a8c0d1
Update B-自然语言处理/B-专题-句向量.md
imhuay Oct 20, 2018
d40ddd8
Update B-自然语言处理/B-专题-句嵌入.md
imhuay Oct 20, 2018
d5215b3
Update C-算法/专题-A-字符串.md
imhuay Oct 20, 2018
3948053
Update C-算法/专题-B-双指针.md
imhuay Oct 20, 2018
7cb8a72
Update B-自然语言处理/B-专题-词向量.md
imhuay Oct 20, 2018
097e5cc
Update B-自然语言处理/D-视觉问答-1_综述.md
imhuay Oct 20, 2018
46fa4ea
Update 笔试-迅雷-180912.md (#26)
FIREKUN Nov 1, 2018
63c1fe1
Update 专题-A-数据结构.md (#29)
zhendonghu Nov 7, 2018
b062357
Update
imhuay Feb 12, 2019
3c2b3cc
Add DQU
imhuay Feb 13, 2019
e3905e9
Add NLP趋势
imhuay Feb 13, 2019
b9245a2
Update
imhuay Feb 13, 2019
4b7e80a
Update A-综述.md
imhuay Feb 13, 2019
36e3862
Update A-综述.md
imhuay Feb 15, 2019
278ce70
Update A-机器学习实践.md (#35)
jeffery-ljf Feb 25, 2019
fff1b87
Update README.md
imhuay Feb 25, 2019
f75a43c
Update README.md
imhuay Feb 25, 2019
62f58c3
Update A-NLP发展趋势.md
imhuay Feb 28, 2019
ba8fef0
Update A-机器学习实践.md (#47)
Mar 25, 2019
a274dce
Create 模型压缩.md
imhuay Apr 7, 2019
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
The table of contents is too big for display.
Diff view
Diff view
  •  
  •  
  •  
12 changes: 12 additions & 0 deletions .gitignore
Original file line number Diff line number Diff line change
@@ -1,8 +1,20 @@
# IDE
.idea/
.vscode/

# folder
__*/
.ipynb_checkpoints/
out/

# file
-*
*.zip
*.tgz
Untitled.ipynb
MyCV.pdf
MyCV.md
GSD_*.pdf

# root
/demo.py
Expand Down
151 changes: 151 additions & 0 deletions A-机器学习/A-机器学习基础.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,151 @@
ML-机器学习基础
===

Index
---
<!-- TOC -->

- [偏差与方差](#偏差与方差)
- [导致偏差和方差的原因](#导致偏差和方差的原因)
- [深度学习中的偏差与方差](#深度学习中的偏差与方差)
- [偏差/方差 与 Boosting/Bagging](#偏差方差-与-boostingbagging)
- [偏差与方差的计算公式](#偏差与方差的计算公式)
- [偏差与方差的权衡(过拟合与模型复杂度的权衡)](#偏差与方差的权衡过拟合与模型复杂度的权衡)
- [生成模型与判别模型](#生成模型与判别模型)
- [先验概率与后验概率](#先验概率与后验概率)

<!-- /TOC -->


## 偏差与方差
> 《机器学习》 2.5 偏差与方差 - 周志华
- **偏差**与**方差**分别是用于衡量一个模型**泛化误差**的两个方面;
- 模型的**偏差**,指的是模型预测的**期望值**与**真实值**之间的差;
- 模型的**方差**,指的是模型预测的**期望值**与**预测值**之间的差平方和;
- 在**监督学习**中,模型的**泛化误差**可**分解**为偏差、方差与噪声之和。
<div align="center"><img src="../_assets/TIM截图20180817204652.png" height="" /></div>

- **偏差**用于描述模型的**拟合能力**;<br/>
**方差**用于描述模型的**稳定性**。
<div align="center"><img src="../_assets/TIM截图20180817192259.png" height="" /></div>

### 导致偏差和方差的原因
- **偏差**通常是由于我们对学习算法做了**错误的假设**,或者模型的复杂度不够;
- 比如真实模型是一个二次函数,而我们假设模型为一次函数,这就会导致偏差的增大(欠拟合);
- **由偏差引起的误差**通常在**训练误差**上就能体现,或者说训练误差主要是由偏差造成的
- **方差**通常是由于**模型的复杂度相对于训练集过高**导致的;
- 比如真实模型是一个简单的二次函数,而我们假设模型是一个高次函数,这就会导致方差的增大(过拟合);
- **由方差引起的误差**通常体现在测试误差相对训练误差的**增量**上。

### 深度学习中的偏差与方差
- 神经网络的拟合能力非常强,因此它的**训练误差**(偏差)通常较小;
- 但是过强的拟合能力会导致较大的方差,使模型的测试误差(**泛化误差**)增大;
- 因此深度学习的核心工作之一就是研究如何降低模型的泛化误差,这类方法统称为**正则化方法**。
> ../深度学习/[正则化](../A-深度学习/C-专题-正则化)

### 偏差/方差 与 Boosting/Bagging
> ./集成学习专题/[Boosting/Bagging 与 偏差/方差 的关系](./C-专题-集成学习#boostingbagging-与-偏差方差-的关系)

### 偏差与方差的计算公式
- 记在**训练集 D** 上学得的模型为
<div align="center"><a href="http://www.codecogs.com/eqnedit.php?latex=f(\boldsymbol{x};D)"><img src="../_assets/公式_20180817211749.png" height="" /></a></div>

模型的**期望预测**为
<div align="center"><a href="http://www.codecogs.com/eqnedit.php?latex=\large&space;\hat{f}(\boldsymbol{x})=\mathbb{E}_D[f(\boldsymbol{x};D)]"><img src="../_assets/公式_20180817210758.png" height="" /></a></div>

- **偏差**(Bias)
<div align="center"><a href="http://www.codecogs.com/eqnedit.php?latex=\large&space;bias^2(\boldsymbol{x})=(\hat{f}(\boldsymbol{x})-y)^2"><img src="../_assets/公式_20180817210106.png" height="" /></a></div>

> **偏差**度量了学习算法的期望预测与真实结果的偏离程度,即刻画了学习算法本身的拟合能力;
- **方差**(Variance)
<div align="center"><a href="http://www.codecogs.com/eqnedit.php?latex=\large&space;var(\boldsymbol{x})=\mathbb{E}_D\left&space;[&space;\left&space;(&space;f(\boldsymbol{x};D)-\hat{f}(\boldsymbol{x})&space;\right&space;)^2&space;\right&space;]"><img src="../_assets/公式_20180817211903.png" height="" /></a></div>

> **方差**度量了同样大小的**训练集的变动**所导致的学习性能的变化,即刻画了数据扰动所造成的影响(模型的稳定性);
<!-- - **噪声**
<div align="center"><a href="http://www.codecogs.com/eqnedit.php?latex=\large&space;var(\boldsymbol{x})=\mathbb{E}_D\left&space;[&space;\left&space;(&space;f(\boldsymbol{x};D)-\hat{f}(\boldsymbol{x})&space;\right&space;)^2&space;\right&space;]"><img src="../_assets/公式_20180817212111.png" height="" /></a></div> -->

- **噪声**则表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界,即刻画了学习问题本身的难度。

- “**偏差-方差分解**”表明模型的泛化能力是由算法的能力、数据的充分性、任务本身的难度共同决定的。

### 偏差与方差的权衡(过拟合与模型复杂度的权衡)
- 给定学习任务,
- 当训练不足时,模型的**拟合能力不够**(数据的扰动不足以使模型产生显著的变化),此时**偏差**主导模型的泛化误差;
- 随着训练的进行,模型的**拟合能力增强**(模型能够学习数据发生的扰动),此时**方差**逐渐主导模型的泛化误差;
- 当训练充足后,模型的**拟合能力过强**(数据的轻微扰动都会导致模型产生显著的变化),此时即发生**过拟合**(训练数据自身的、非全局的特征也被模型学习了)

- 偏差和方差的关系和**模型容量**(模型复杂度)、**欠拟合**和**过拟合**的概念紧密相联
<div align="center"><img src="../_assets/TIM截图20180817214034.png" height="" /></div>

- 当模型的容量增大(x 轴)时, 偏差(用点表示)随之减小,而方差(虚线)随之增大
- 沿着 x 轴存在**最佳容量**,**小于最佳容量会呈现欠拟合**,**大于最佳容量会导致过拟合**。
> 《深度学习》 5.4.4 权衡偏差和方差以最小化均方误差

**Reference**
- [Understanding the Bias-Variance Tradeoff](http://scott.fortmann-roe.com/docs/BiasVariance.html)
- [机器学习中的Bias(偏差),Error(误差),和Variance(方差)有什么区别和联系?](https://www.zhihu.com/question/27068705) - 知乎


## 生成模型与判别模型
> 《统计学习方法》 1.7 生成模型与判别模型
- 监督学习的任务是学习一个模型,对给定的输入预测相应的输出
- 这个模型的一般形式为一个**决策函数**或一个**条件概率分布**(后验概率):
<div align="center"><a href="http://www.codecogs.com/eqnedit.php?latex=\fn_phv&space;\large&space;Y=f(X)\quad&space;\text{or}\quad&space;P(Y|X)"><img src="../_assets/公式_20180817220004.png" height="" /></a></div>

- **决策函数**:输入 X 返回 Y;其中 Y 与一个**阈值**比较,然后根据比较结果判定 X 的类别
- **条件概率分布**:输入 X 返回 **X 属于每个类别的概率**;将其中概率最大的作为 X 所属的类别
- 监督学习模型可分为**生成模型**与**判别模型**
- **判别模型**直接学习决策函数或者条件概率分布
- 直观来说,**判别模型**学习的是类别之间的最优分隔面,反映的是不同类数据之间的差异
- **生成模型**学习的是联合概率分布`P(X,Y)`,然后根据条件概率公式计算 `P(Y|X)`
<div align="center"><a href="http://www.codecogs.com/eqnedit.php?latex=\fn_phv&space;\large&space;P(Y|X)=\frac{P(X,Y)}{P(X)}"><img src="../_assets/公式_20180817223923.png" height="" /></a></div>

**两者之间的联系**
- 由生成模型可以得到判别模型,但由判别模型得不到生成模型。
- 当存在“**隐变量**”时,只能使用**生成模型**
> 隐变量:当我们找不到引起某一现象的原因时,就把这个在起作用,但无法确定的因素,叫“隐变量”

**优缺点**
- **判别模型**
- 优点
- 直接面对预测,往往学习的准确率更高
- 由于直接学习 `P(Y|X)` 或 `f(X)`,可以对数据进行各种程度的抽象,定义特征并使用特征,以简化学习过程
- 缺点
- 不能反映训练数据本身的特性
- ...
- **生成模型**
- 优点
- 可以还原出联合概率分布 `P(X,Y)`,判别方法不能
- 学习收敛速度更快——即当样本容量增加时,学到的模型可以更快地收敛到真实模型
- 当存在“隐变量”时,只能使用生成模型
- 缺点
- 学习和计算过程比较复杂

**常见模型**
- 判别模型
- K 近邻、感知机(神经网络)、决策树、逻辑斯蒂回归、**最大熵模型**、SVM、提升方法、**条件随机场**
- 生成模型
- 朴素贝叶斯、隐马尔可夫模型、混合高斯模型、贝叶斯网络、马尔可夫随机场

**Reference**
- [机器学习---生成模型与判别模型](https://blog.csdn.net/u012101561/article/details/52814571) - CSDN博客
-

## 先验概率与后验概率
> [先验概率,后验概率,似然概率,条件概率,贝叶斯,最大似然](https://blog.csdn.net/suranxu007/article/details/50326873) - CSDN博客

**条件概率**(似然概率)
- 一个事件发生后另一个事件发生的概率。
- 一般的形式为 `P(X|Y)`,表示 y 发生的条件下 x 发生的概率。
- 有时为了区分一般意义上的**条件概率**,也称**似然概率**

**先验概率**
- 事件发生前的预判概率
- 可以是基于历史数据的统计,可以由背景常识得出,也可以是人的主观观点给出。
- 一般都是**单独事件**发生的概率,如 `P(A)`、`P(B)`。

**后验概率**
- 基于先验概率求得的**反向条件概率**,形式上与条件概率相同(若 `P(X|Y)` 为正向,则 `P(Y|X)` 为反向)

**贝叶斯公式**
<div align="center"><a href="http://www.codecogs.com/eqnedit.php?latex=\fn_phv&space;\large&space;P(Y|X)=\frac{P(X|Y)*P(Y)}{P(X)}"><img src="../_assets/公式_20180817230314.png" height="" /></a></div>
Loading