上一页 1 ··· 30 31 32 33 34 35 36 37 38 ··· 59 下一页
摘要: 1 阅读全文
posted @ 2019-08-23 20:07 wqbin 阅读(220) 评论(0) 推荐(0)
摘要: 1 阅读全文
posted @ 2019-08-23 20:06 wqbin 阅读(153) 评论(0) 推荐(0)
摘要: 1 阅读全文
posted @ 2019-08-19 20:58 wqbin 阅读(303) 评论(0) 推荐(0)
摘要: 1.稀里糊涂下载 我的集群是hadoop 2.7.3 ,本来想找到对应的mahout版本,但是没有找到。本着安全原则,mahout最新版本是0.14.0,回退一个版本使用0.13.0 mahout地址 2.安装后 一波操作:解压到D:Zoo和配置好环境变量后,运行报错!!! D:\Zoo\apach 阅读全文
posted @ 2019-08-17 20:49 wqbin 阅读(844) 评论(2) 推荐(0)
摘要: 今天发现自己POM变成了红橙色。 原因未知:看到上网有3~4种方法。尝试了一下都不行然后采用的换java jdk的方法,然后就解决了。 在设置中maven有几个属性。 1.改变java jre环境 也不知为什么,我的电脑上有三套java环境。 本来是idea内置的java环境。后来我改成了java_ 阅读全文
posted @ 2019-08-17 20:42 wqbin 阅读(2729) 评论(0) 推荐(0)
摘要: 1.定义 拉链表是一种数据库设计模,用于储存历史数据和分析时间维度的数据。 所谓拉链,就是记录历史。记录一个事物从开始,一直到当前状态的所有变化的信息。 关键点: 储存开始时间和结束时间。 开始时间和结束时间首尾相接,形成链式结构。 拉链表一般用于解决历史版本查询的问题,也可用于解决数值区间问题,查 阅读全文
posted @ 2019-08-17 13:03 wqbin 阅读(6719) 评论(0) 推荐(0)
摘要: 1.数据集介绍 20newsgroups数据集是用于文本分类、文本挖据和信息检索研究的国际标准数据集之一。 数据集收集了大约20,000左右的新闻组文档,均匀分为20个不同主题的新闻组集合。 一些新闻组的主题特别相似(e.g. comp.sys.ibm.pc.hardware/ comp.sys.m 阅读全文
posted @ 2019-08-11 14:57 wqbin 阅读(2052) 评论(0) 推荐(0)
摘要: python环境是Anaconda3安装的,由于项目需要用到git的第三方包,但是在conda自带的环境中没有。 例如使用jieba分词库。 安装的三种方式: (1)全自动安装:`easy_install jieba` 或者 `pip install jieba` / `pip3 install j 阅读全文
posted @ 2019-08-09 11:50 wqbin 阅读(618) 评论(0) 推荐(0)
摘要: 1 阅读全文
posted @ 2019-08-09 00:19 wqbin 阅读(324) 评论(6) 推荐(0)
摘要: 1 阅读全文
posted @ 2019-08-08 23:57 wqbin 阅读(285) 评论(0) 推荐(0)
上一页 1 ··· 30 31 32 33 34 35 36 37 38 ··· 59 下一页