摘要: <Spark快速大数据分析>主要使用java, scala和python进行讲解,因博主暂未对java和scala展开了解,所以后续总结只通过python3进行展示。 Part 1 Spark简介 Spark的定位:是一个用来实现快速而通用的集群计算平台。 Spark与Hadoop的联系:Spark 阅读全文
posted @ 2018-01-30 20:42 McConor 阅读(219) 评论(0) 推荐(0)
摘要: 持续更新中... 1.k-近邻算法 优势:精度高、对异常值不敏感、无数据输入设定 缺点:计算复杂度高、空间复杂度高 适用数据范围:数值型和标称型 适用场景: 2.ID3决策树算法 优势:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据 劣势:可能会产生过度匹配问题 适用 阅读全文
posted @ 2017-12-30 13:01 McConor 阅读(1046) 评论(0) 推荐(0)
摘要: 2017.12.1-至今: 1.<机器学习实战>看到支持向量机,觉得基础还是有些薄弱 2.<Spark快速大数据分析> 2017.10.16-2017.12.17 1.<Python3网络爬虫实战案例> --崔庆才 看完,代码过完(部分需要云主机的章节未实践) 2017.9.1-2017.10.15 阅读全文
posted @ 2017-12-29 18:39 McConor 阅读(143) 评论(0) 推荐(0)