Stanford-MachineLearning

Stanford Coursera Machine Learning
Andrew Ng

#MATLAB

The heart of MATLAB is matrix.
Default data type is double.
Lambda: g = arrayfun(@(x) 1/(1+exp(-x)), z);.
Mathematical operations use index starting from 1. And X(1, :) is different from X(1).
A(:) is used for matrix unrolling to vector.
theta'*theta is different from theta*theta'; thus theta .^2 is preferred.
dpquit to quit the debug mode.
X(2:end, :): use end for slicing.
Cell array is indexed by A{1}.
~ to skip a return value: [U, S, ~] = svd(Sigma).
Matrix multiplication orders depend on whether the data point is a col vector or row vector.
For loop: for epsilon = min(pval):stepsize:max(pval)

Index

Linear Regression with Multiple Variables

Cost function for one var
Gradient descent for one var
Feature normalization
Cost function for multi-var
Gradient descent for multi-var
Normal Equations

Regularization - Logistic Regression

Sigmoid function
Cost function for logistic regression (LR)
Gradient descent for LR
Predict function (hypothesis)
Cost function for regularized LR
Gradient descent for regularized LR

![](http://latex.codecogs.com/gif.latex?\\frac{\\partial J(\theta)}{\partial \theta_j} = \Bigg(\frac{1}{m}\sum_{i=1}^m{\big(h_\theta(x^{(i)})-y^{(i)}\big)x_j^{(i)}}\Bigg)+\frac{\lambda}{m}\theta_j)

Neural Networks: Representation

Regularized Logistic Regression
One-vs-all classifier training
One-vs-all classifier prediction
Neural Network predict function

![](http://latex.codecogs.com/gif.latex?\\frac{\\partial J(\theta)}{\partial \theta} = \frac{1}{m}X^T\big(h_\theta(X)-y\big)+\frac{\lambda}{m}\theta)

Neural Networks: Learning

Feedforward and cost function
Regularized cost function
Sigmoid gradient
Neural Net gradient function (Backpropagation)
Regularized gradient

![](http://latex.codecogs.com/gif.latex?J(\\theta)=\\frac{1}{m}\\sum_{i=1}^{m}\\sum_{k=1}^K{{\\big[-y_k^{(i)}\\log{(h_\\theta(x^{(i)}))_k}-(1-y_k^{(i)})\\log{(1-h_\\theta(x^{(i)}))_k}\\big]}}+\\frac{\\lambda}{2m}\\sum_{l}{\\sum_{j\\in (l+1)}{\sum_{k\in l}{(\Theta_{j,k}^{(l)})^2}}})

![](http://latex.codecogs.com/gif.latex?\\delta^{(l)}= (\Theta^{(l)})^T\delta^{(l+1)}\circ g'(z^{(l)}))

![](http://latex.codecogs.com/gif.latex?\\frac{\\partial}{\\partial \Theta_{ij}^{(l)}}J(\Theta)=D_{ij}^{(l)}=\frac{1}{m}\Delta_{ij}^{(l)}+\frac{\lambda}{m}\Theta_{ij}^{(l)})

Regularized Linear Regression and Bias/Variance

Regularized LR, cost function (review)
Regularized LR, gradient (review)
Learning Curve - Bias-Variance trade-off
Polynomial feature mapping
Cross validation curve - (select lambda)

![](http://latex.codecogs.com/gif.latex?h_\\theta(x)=\\theta_0+\\theta_1 x_1+...+\theta_p x_p), where x_i = normalize(x .^ i)

Support Vector Machines

Gaussian Kernel
Parameters (C, sigma)
Email preprocessing
Email feature extraction

![](http://latex.codecogs.com/gif.latex?\\operatornamewithlimits{min}_\\theta C\sum_{i=1}^{m}{\big[y^{(i)}cost_1{(\theta^Tx^{(i)})}+(1-y^{(i)})cost_0{(\theta^Tx^{(i)})}\big]}+\frac{1}{2}\sum_{j=1}^n{\theta_j^2})
![](http://latex.codecogs.com/gif.latex?K_{gaussian}(x^{(i)}, x^{(j)})=\exp{\Bigg(-\frac{||x^{(i)}-x^{(j)}||^2}{2\sigma^2}\Bigg)})
![](http://latex.codecogs.com/gif.latex?\\operatornamewithlimits{min}_\\theta C\sum_{i=1}^{m}{\big[y^{(i)}cost_1{(\theta^Tf^{(i)})}+(1-y^{(i)})cost_0{(\theta^Tf^{(i)})}\big]}+\frac{1}{2}\sum_{j=1}^n{\theta_j^2})
![](http://latex.codecogs.com/gif.latex?f_k^{(i)} = K(x^{(i)}, l^{(k)}))

K-Means Clustering and PCA

Find closest centroids
Compute centroid means
PCA
Project data
Recover data

![](http://latex.codecogs.com/gif.latex?c^{(i)}:= \operatornamewithlimits{argmin}_{j} ||x^{(i)}-\mu_j||^2)
![](http://latex.codecogs.com/gif.latex?\\mu_k:=\\frac{1}{C_k}\\sum_{i \in C_k}{x^{(i)}})

Anomaly Detection and Recommender Systems

Estimate Gaussian parameters
Select threshold
Collaborative Filtering cost
Collaborative Filtering gradient
Regularized cost
Gradient with regularization

![](http://latex.codecogs.com/gif.latex?\\frac{\\partial J}{\partial x_k^{(i)}}=\sum_{j:r(i,j)=1}{\big((\theta^{(j)})^Tx^{(i)}-y^{(i,j)}\big)\theta_k^{(j)}}+\lambda x_k^{(i)})
![](http://latex.codecogs.com/gif.latex?\\frac{\\partial J}{\partial \theta_k^{(j)}}=\sum_{i:r(i,j)=1}{\big((\theta^{(j)})^Tx^{(i)}-y^{(i,j)}\big)x_k^{(i)}}+\lambda \theta_k^{(j)})

Name		Name	Last commit message	Last commit date
Latest commit History 40 Commits
img		img
mlclass-ex1-008		mlclass-ex1-008
mlclass-ex2-008		mlclass-ex2-008
mlclass-ex3-008		mlclass-ex3-008
mlclass-ex4-008		mlclass-ex4-008
mlclass-ex5-008		mlclass-ex5-008
mlclass-ex6-008		mlclass-ex6-008
mlclass-ex7-008		mlclass-ex7-008
mlclass-ex8-008		mlclass-ex8-008
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Stanford-MachineLearning

Index

Linear Regression with Multiple Variables

Regularization - Logistic Regression

Neural Networks: Representation

Neural Networks: Learning

Regularized Linear Regression and Bias/Variance

Support Vector Machines

K-Means Clustering and PCA

Anomaly Detection and Recommender Systems

About

Releases

Packages

Languages

License

CourseAce/Stanford-MachineLearning

Folders and files

Latest commit

History

Repository files navigation

Stanford-MachineLearning

Index

Linear Regression with Multiple Variables

Regularization - Logistic Regression

Neural Networks: Representation

Neural Networks: Learning

Regularized Linear Regression and Bias/Variance

Support Vector Machines

K-Means Clustering and PCA

Anomaly Detection and Recommender Systems

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages