摘要:Abstract: 参照入门学习路径学习了两个代码示例,对比我们项目的代码做了笔记。 链接: https://zhuanlan.zhihu.com/p/52753778 https://github.com/apache/spark/blob/master/examples/src/main/sca
阅读全文
posted @ 2021-05-06 20:34
|
|
|
05 2021 档案
摘要:Abstract: 参照入门学习路径学习了两个代码示例,对比我们项目的代码做了笔记。 链接: https://zhuanlan.zhihu.com/p/52753778 https://github.com/apache/spark/blob/master/examples/src/main/sca
阅读全文
posted @ 2021-05-06 20:34
摘要:Abstract: 参照“背景知识查阅”一文的学习路径,对几篇文章的学习做了记录。这是"Beginner Tutorial"一文的学习笔记。 文章链接: https://www.datacamp.com/community/tutorials/apache-spark-python 1. 背景知识
阅读全文
posted @ 2021-05-06 17:55
摘要:和三位小伙伴一起做了一个Credit Fraud Detection的项目。数据是Kaggle上的数据,主要是用supervised learning 来解决fraud的(多)分类问题。 这个项目有两个重点:数据处理,算法实现。 因为这是Spark的入门项目,主要的精力放在用PySpark处理数据,
阅读全文
posted @ 2021-05-06 04:25
摘要:PySpark Documentation: https://spark.apache.org/docs/latest/api/python/index.html Beginner Tutorial: https://www.datacamp.com/community/tutorials/apac
阅读全文
posted @ 2021-05-06 04:02
|
|