Fork me on GitHub
上一页 1 ··· 8 9 10 11 12
摘要: python实现层次聚类 阅读全文
posted @ 2017-08-11 13:37 石头木 阅读(15981) 评论(4) 推荐(0) 编辑
摘要: 使用python实现一个Naive Bayes分类方法,针对没有的属性会导致预测为0的结果,使用平滑方法;另外针对数值型属性假设它满足正态分布,使用正态分布计算数值型属性概率。 阅读全文
posted @ 2017-08-07 12:29 石头木 阅读(7385) 评论(0) 推荐(0) 编辑
摘要: java和python实现一个加权SlopeOne推荐算法 阅读全文
posted @ 2017-07-28 17:26 石头木 阅读(2226) 评论(0) 推荐(0) 编辑
摘要: java实现文本摘要程序 阅读全文
posted @ 2017-07-16 18:21 石头木 阅读(1790) 评论(0) 推荐(0) 编辑
摘要: 下面是测试结果: 阅读全文
posted @ 2017-04-12 23:35 石头木 阅读(9409) 评论(0) 推荐(0) 编辑
摘要: 一.下载中文维基百科数据https://dumps.wikimedia.org/zhwiki/并使用gensim中的wikicorpus解析提取xml中的内容 二.利用opencc繁体转简体 三.利用jieba对转换后的文本进行分词,去停词 四.利用gensim中的word2vec训练分词后的文本 阅读全文
posted @ 2017-04-12 23:15 石头木 阅读(8217) 评论(0) 推荐(2) 编辑
摘要: http://www.quora.com/What-is-data-science 数据科学是什么? http://www.quora.com/How-do-I-become-a-data-scientist 我怎样才能成为一个数据科学家? http://www.quora.com/Data-Sci 阅读全文
posted @ 2016-12-28 11:18 石头木 阅读(1485) 评论(0) 推荐(1) 编辑
摘要: http://blog.csdn.net/jaccen2012/article/details/50301707 机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 1)http://jacoxu.com/?p=1139 计算机IT求职学习Lis 阅读全文
posted @ 2016-12-16 08:42 石头木 阅读(332) 评论(0) 推荐(0) 编辑
摘要: 初始化SparkContext 关闭spark可以用SparkContext的stop()方法,或直接退出应用,如System.exit(0)或sys.exit() 参考《spark快速大数据分析》 阅读全文
posted @ 2016-12-12 23:24 石头木 阅读(1988) 评论(0) 推荐(0) 编辑
摘要: 1 java 代码,摘自《java 编程艺术》 2 3 /** 4 * 航班信息类 5 * 用于存放航班线路 6 * @author shiyan 7 * 8 */ 9 public class FlightInfo { 10 String from;//出发城市 11 String to;//目的城市 12 int distance;//距离 13... 阅读全文
posted @ 2016-12-12 22:56 石头木 阅读(724) 评论(0) 推荐(0) 编辑
上一页 1 ··· 8 9 10 11 12