Skip to content

Latest commit

 

History

History
116 lines (42 loc) · 1.01 KB

00 Machine Learning with PySpark 目录.md

File metadata and controls

116 lines (42 loc) · 1.01 KB

Machine Learning with PySpark

With Natural Language Processing and Recommender Systems (2019版)

Pramod Singh

中文翻译

1. 数据的演变

1.1 数据的生成

1.2 Spark

spark core

spark 组件

1.3 设置环境

windows

anaconda

java安装

spark安装

IOS

docker

datatricks

1.4 结论

2. 机器学习介绍

2.1 监督学习

2.2 非监督学习

2.3 半监督学习

2.4 强化学习

2.5 结论

3. 数据处理

3.1 读取数据

3.2 增加新列

3.3 过滤数据

3.4 一列中的不同取值

3.5 数据分组

3.6 聚合

3.7 自定义函数

3.8 删除重复值

3.9 删除列

3.10 写数据

3.11 结论

4. 线性回归

5. 逻辑回归

6. 随机森林

7. 推荐系统

8. 聚类

9. 自然语言处理