摘要: 1、下载hadoop https://hadoop.apache.org/releases.html 2、上传文件,解压,重命名 3、配置环境变量 4、配置生效 5、进入安装的hadoop 下的 etc/hadoop/目录 6、修改配置文件 7、初始化操作 8、验证hadoop是否安装成功:进入你安 阅读全文
posted @ 2019-08-26 17:27 温文尔雅的蜗牛 阅读(386) 评论(0) 推荐(0) 编辑
摘要: 1、上传scala和spark架包 scala官网下载:https://www.scala-lang.org/download/ spark官网下载:http://spark.apache.org/downloads.html 2、解压包,重命名 3、配置scala 和spark的环境变量 4、加载 阅读全文
posted @ 2019-08-26 17:13 温文尔雅的蜗牛 阅读(534) 评论(0) 推荐(0) 编辑
摘要: 最近在工作上,需要在centos上面装spark大数据环境,特此记录一下单机spark部署步骤: 一、Centos7安装mysql 1、官网下载mysql-5.5.61-linux-glibc2.12-x86_64.tar.gz安装包 (使用在线安装,受网络影响,推荐离线安装) 下载地址:https 阅读全文
posted @ 2019-08-23 18:10 温文尔雅的蜗牛 阅读(327) 评论(0) 推荐(0) 编辑
摘要: KNN算法原理 KNN(K-Nearest Neighbor)最邻近分类算法是数据挖掘分类(classification)技术中最简单的算法之一,其指导思想是”近朱者赤,近墨者黑“,即由你的邻居来推断出你的类别。 KNN最邻近分类算法的实现原理:为了判断未知样本的类别,以所有已知类别的样本作为参照, 阅读全文
posted @ 2019-08-15 23:08 温文尔雅的蜗牛 阅读(120) 评论(0) 推荐(0) 编辑
摘要: 先自我介绍下,本人在某视频厂商做过三四年Java开发,离职后在某制造行业做机器学习,基本上算是进了一个新的领域,新的行业,里面基本上都是研究生以上,我一个小本科,在奔三的路上,做这个的决定,压力肯定是有的,不管前方道路如何,既然选择了,已然没有退路,只管风雨兼程走下去,因为初次接触机器学习,相比其他 阅读全文
posted @ 2019-08-15 18:41 温文尔雅的蜗牛 阅读(141) 评论(1) 推荐(0) 编辑
摘要: 学习资料是我在学习过程中,认为比较好的书籍,刚开始比较少,之后会逐渐增多。 机器学习参考资料: 《机器学习实战》 说 明:机器学习实战(高清 中/英文版),Python写的,基本上都是实例为主,代码很详细,讲的也很通俗易懂,适合机器学习入门 推荐指数:五颗星 阅读全文
posted @ 2019-08-15 18:37 温文尔雅的蜗牛 阅读(1188) 评论(0) 推荐(0) 编辑