Fork me on GitHub
摘要: python实现kmeans与kmeans++方法 阅读全文
posted @ 2017-08-11 18:14 石头木 阅读(8601) 评论(0) 推荐(0)
摘要: python实现层次聚类 阅读全文
posted @ 2017-08-11 13:37 石头木 阅读(16081) 评论(4) 推荐(0)
摘要: 使用python实现一个Naive Bayes分类方法,针对没有的属性会导致预测为0的结果,使用平滑方法;另外针对数值型属性假设它满足正态分布,使用正态分布计算数值型属性概率。 阅读全文
posted @ 2017-08-07 12:29 石头木 阅读(7414) 评论(0) 推荐(0)
摘要: java和python实现一个加权SlopeOne推荐算法 阅读全文
posted @ 2017-07-28 17:26 石头木 阅读(2262) 评论(0) 推荐(0)
摘要: java实现文本摘要程序 阅读全文
posted @ 2017-07-16 18:21 石头木 阅读(1868) 评论(0) 推荐(0)
摘要: 下面是测试结果: 阅读全文
posted @ 2017-04-12 23:35 石头木 阅读(9556) 评论(0) 推荐(0)
摘要: 一.下载中文维基百科数据https://dumps.wikimedia.org/zhwiki/并使用gensim中的wikicorpus解析提取xml中的内容 二.利用opencc繁体转简体 三.利用jieba对转换后的文本进行分词,去停词 四.利用gensim中的word2vec训练分词后的文本 阅读全文
posted @ 2017-04-12 23:15 石头木 阅读(8498) 评论(0) 推荐(2)
摘要: http://www.quora.com/What-is-data-science 数据科学是什么? http://www.quora.com/How-do-I-become-a-data-scientist 我怎样才能成为一个数据科学家? http://www.quora.com/Data-Sci 阅读全文
posted @ 2016-12-28 11:18 石头木 阅读(1510) 评论(0) 推荐(1)
摘要: http://blog.csdn.net/jaccen2012/article/details/50301707 机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 1)http://jacoxu.com/?p=1139 计算机IT求职学习Lis 阅读全文
posted @ 2016-12-16 08:42 石头木 阅读(340) 评论(0) 推荐(0)
摘要: 初始化SparkContext 关闭spark可以用SparkContext的stop()方法,或直接退出应用,如System.exit(0)或sys.exit() 参考《spark快速大数据分析》 阅读全文
posted @ 2016-12-12 23:24 石头木 阅读(2020) 评论(0) 推荐(0)