摘要: 温度排序代码,具体说明可以搜索其他博客 KeyPair.java Sort.java: Partition.java: Group.java: RunJob.java: 其中自定义的sort和parititon是在mapTask任务之后使用的,而Group是在reduce任务使用的。 阅读全文
posted @ 2018-03-29 16:20 DamonDr 阅读(622) 评论(0) 推荐(0) 编辑
摘要: 一,背景介绍 在新浪微博、人人网等社交网站上,为了使用户在网络上认识更多的朋友,社交网站往往提供类似“你可能感兴趣的人”、“间接关注推荐”等好友推荐的功能,其中就包含了二度人脉算法。 二,算法实现 原始数据集测试: 数据集说明:为关注关系,即a关注b,b关注c和d,所以a的二度人脉应该是d和c,而c 阅读全文
posted @ 2018-03-29 15:59 DamonDr 阅读(1598) 评论(0) 推荐(0) 编辑
摘要: 一,环境配置 1,修改win下的host文件:即C:\Windows\System32\drivers\etc\host中添加集群中机子的ip 2,win下hadoop,并为win的环境变量配置hadoop_home,添加winutils.exe放到$HADOOP_HOME/bin下 3,使用ide 阅读全文
posted @ 2018-03-29 15:39 DamonDr 阅读(820) 评论(0) 推荐(0) 编辑
摘要: 数据结构排序总结 排序概念: 1,排序要素:稳定性(相同关键字时,相对顺序是否发生变化),时间复杂度,空间复杂度: 2,排序分类:内部排序(内排序适用于记录个数不很多的小文件,计算在内存中),外部排序(外排序则适用于记录个数太多,不能一次将其全部记录放人内存的大文件) 内部排序: 1,插入排序 插入 阅读全文
posted @ 2017-10-24 21:27 DamonDr 阅读(1455) 评论(0) 推荐(0) 编辑
摘要: 1, 数据结构三要素: 1,逻辑结构:线性和非线性 2,存储结构:顺序,链式,索引,散列 3,数据运算:算法 具体时间复杂度与问题的规模和初始条件相关,分最佳和最大 2, 线性表: 无头结点: 头插法:s->data=ch;s->next=head;head=s; 尾插法:rear->next=s; 阅读全文
posted @ 2017-09-23 20:28 DamonDr 阅读(35122) 评论(0) 推荐(1) 编辑
摘要: 逻辑回归分类 1,概念 2,算法流程 3,多分类逻辑回归 4,逻辑回归总结 优点: 1)预测结果是界于0和1之间的概率; 2)可以适用于连续性和类别性自变量; 3)容易使用和解释; 缺点: 1)对模型中自变量多重共线性较为敏感,例如两个高度相关自变量同时放入模型,可能导致较弱的一个自变量回归符号不符 阅读全文
posted @ 2017-09-03 16:47 DamonDr 阅读(659) 评论(0) 推荐(0) 编辑
摘要: 决策树分类 1,概念 2,决策树算法 2.1,特征选择: 熵:值越大,不确定性因素越大;条件熵:即已知x存在的情况下求y的不确定性(越小越好);信息增益(互信息):熵减去条件熵(度量了X在知道Y以后不确定性减少程度),越大越好; 2.2,决策树生成算法 1,ID3算法 2,c4.5算法 信息增益率等 阅读全文
posted @ 2017-09-02 21:59 DamonDr 阅读(1136) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯分类 1,基本概念 2,算法流程 关键点:理解先验概率,条件概率,最大后验概率,下面是以极大似然估计的 3,算法改进(贝叶斯估计) 上述用极大似然估计可能会出现所要估计的概率值为0的情况,改进方法: 先验概率贝叶斯估计:K表示类别数,λ为参数:0时为极大似然估计;1时为拉普拉斯平滑 条件概 阅读全文
posted @ 2017-09-02 19:51 DamonDr 阅读(562) 评论(0) 推荐(0) 编辑
摘要: Java小案例-(逃离迷宫) 一,迷宫需求描述: 1,用户输入迷宫图(限制方形):字母1位墙,0为通,e为出口,m为入口,*为已访问的位置,用外围1围住迷宫 2,运行轨迹右,左,下,上 3,判断该迷宫是否能从入口走到出口,并将搜索过程输出 二,迷宫实现: 1,迷宫元素类MazeCell: 2,迷宫搜 阅读全文
posted @ 2017-08-19 22:43 DamonDr 阅读(915) 评论(0) 推荐(0) 编辑
摘要: Java小案例 行星移动:参考:三百集 使用软件:idea2017,java 1,图片集:这里 (idea图片源放在target目录下,才能访问到),建议从小往上看。。。 2,定义MyFrame 2,定义ImageUtil类: 3,定义常量类,相当于配置文件 4,定义Start类 5,定义Plant 阅读全文
posted @ 2017-08-12 22:46 DamonDr 阅读(1007) 评论(0) 推荐(0) 编辑