Machine Learning with PySpark With Natural Language Processing and Recommender Systems (2019版) Pramod Singh 中文翻译 1. 数据的演变 1.1 数据的生成 1.2 Spark spark core spark 组件 1.3 设置环境 windows anaconda java安装 spark安装 IOS docker datatricks 1.4 结论 2. 机器学习介绍 2.1 监督学习 2.2 非监督学习 2.3 半监督学习 2.4 强化学习 2.5 结论 3. 数据处理 3.1 读取数据 3.2 增加新列 3.3 过滤数据 3.4 一列中的不同取值 3.5 数据分组 3.6 聚合 3.7 自定义函数 3.8 删除重复值 3.9 删除列 3.10 写数据 3.11 结论 4. 线性回归 5. 逻辑回归 6. 随机森林 7. 推荐系统 8. 聚类 9. 自然语言处理