McConor

2018年1月30日

摘要： <Spark快速大数据分析>主要使用java, scala和python进行讲解，因博主暂未对java和scala展开了解，所以后续总结只通过python3进行展示。 Part 1 Spark简介 Spark的定位：是一个用来实现快速而通用的集群计算平台。 Spark与Hadoop的联系：Spark 阅读全文

posted @ 2018-01-30 20:42 McConor 阅读(229) 评论(0) 推荐(0)

2017年12月30日

机器学习算法优劣势及适用场景总结

摘要：持续更新中... 1.k-近邻算法优势：精度高、对异常值不敏感、无数据输入设定缺点：计算复杂度高、空间复杂度高适用数据范围：数值型和标称型适用场景： 2.ID3决策树算法优势：计算复杂度不高，输出结果易于理解，对中间值的缺失不敏感，可以处理不相关特征数据劣势：可能会产生过度匹配问题适用阅读全文

posted @ 2017-12-30 13:01 McConor 阅读(1077) 评论(0) 推荐(0)

2017年12月29日

数据挖掘读书与学习记录

摘要： 2017.12.1-至今: 1.<机器学习实战>看到支持向量机，觉得基础还是有些薄弱 2.<Spark快速大数据分析> 2017.10.16-2017.12.17 1.<Python3网络爬虫实战案例> --崔庆才看完，代码过完(部分需要云主机的章节未实践) 2017.9.1-2017.10.15 阅读全文

posted @ 2017-12-29 18:39 McConor 阅读(144) 评论(0) 推荐(0)

公告