摘要: org.apache.hadoop.ipc.RemoteException(java.io.IOException): File could only be replicated to 0 nodes instead of minReplication (=1). There are 1 datan 阅读全文
posted @ 2021-01-22 02:22 计网好难 阅读(147) 评论(0) 推荐(1)
摘要: weka 聚类的使用 流程 使用loader类的setfile()方法读入数据 使用Loader类的getDataSet()方法得到Instances类的训练集 new一个Clusterer接口的实现(如EM,SimpleKmeans),使用buildClusterer(Instances )方法开 阅读全文
posted @ 2020-12-27 18:39 计网好难 阅读(225) 评论(0) 推荐(0)
摘要: 西瓜书7.3 朴素贝叶斯分类器 实现拉普拉斯修正的朴素贝叶斯分类器 定义输入 输入为Object二维数组objects,objects[i][j]表示第i个西瓜的第j个属性 Object[][]objects={ {"青绿", "蜷缩", "浊响", "清晰", "凹陷", "硬滑", 0.697, 阅读全文
posted @ 2020-12-17 11:10 计网好难 阅读(177) 评论(0) 推荐(1)
摘要: 西瓜书6.2 使用libsvm 试使用LIBSVM,在西瓜数据集上分别用线性核和高斯核训练svm,并比较支持向量的差别 导入依赖 <dependencies> <dependency> <groupId>tw.edu.ntu.csie</groupId> <artifactId>libsvm</ar 阅读全文
posted @ 2020-12-17 11:02 计网好难 阅读(447) 评论(0) 推荐(0)
摘要: 西瓜书 4.3 决策树C4.5实现 1.定义输入输出,树的样子 输入为二维Object数组objects,object[i]代表第i个西瓜 Object[][]objects={ {"青绿", "蜷缩", "浊响", "清晰", "凹陷", "硬滑", 0.697, 0.460, "好瓜"}, {" 阅读全文
posted @ 2020-12-17 10:46 计网好难 阅读(452) 评论(0) 推荐(0)
摘要: 西瓜书9.4 k均值算法实现 一.需求: ​ 编程实现k均值算法,在西瓜数据集4.0上进行实验比较 二.伪代码: ​ 三.代码实现: ​ 1. main方法: ​ 输入为n*2的二维数组,调用KMeans类的train方法训练,输出为每次迭代后的散点图 public class Main { pub 阅读全文
posted @ 2020-12-08 23:53 计网好难 阅读(513) 评论(0) 推荐(0)
摘要: Jupyter的使用 1.命令行启动 jupyter notebook 2.主页面 在这里写代码 3.执行代码 下列语句报错 data=pd.read_csv("2_movie_metadata.csv",dtype={'title_year':str}) FileNotFoundError: [E 阅读全文
posted @ 2020-12-08 15:06 计网好难 阅读(756) 评论(0) 推荐(1)
摘要: 安装gradle 1.下载gradle ​ https://gradle.org/releases/ 2.配置环境变量 ​ 这里用的是maven仓库目录 3.检查是否装好 4.在gradle安装目录下init.d文件夹下新建文件 init.gradle ,内容如下 repositories { ma 阅读全文
posted @ 2020-12-06 19:49 计网好难 阅读(55) 评论(0) 推荐(0)