会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
打赏
大数据和人工智能躺过的坑
我是一枚热衷技术的程序员,我是九月哥,每天都在路上! 3个微信公众号:大数据躺过的坑、九哥九嫂小日子、今日热点在线 2个 百家号:九哥九嫂小日子、九哥聊IT 欢迎您的加入,一起来探讨交流技术。 目前重点研究Spring、Spring boot、Hadoop、HBase、Zookeeper、Flume、Kafka、Sqoop、Hive、Spark、Flink、Docker等,对Kettle二次开发有一定研究。
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
35
36
37
38
39
40
41
42
43
···
180
下一页
2017年8月30日
Spark Mllib里如何将预测结果如0或1,转换为文字描述来显示预测结果输出(图文详解)
摘要: 不多说,直接上干货! 具体,见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章 使用决策树二元分类算法来预测分类StumbleUpon数据集
阅读全文
posted @ 2017-08-30 09:43 大数据和AI躺过的坑
阅读(473)
评论(0)
推荐(0)
2017年8月29日
Spark Mllib里如何将trainDara训练数据的分类特征字段转换为数值字段(图文详解)
摘要: 不多说,直接上干货! 字段3 是分类特征字段,但是呢,在分类算法里不能直接用。所以,必须要转换为数值字段才能够被分类算法使用。 具体,见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章 使用决策树二元分类算法来预测分类StumbleUpon数据集
阅读全文
posted @ 2017-08-29 22:53 大数据和AI躺过的坑
阅读(577)
评论(0)
推荐(0)
Spark Mllib里如何将trainDara训练数据文件里提取第M到第N字段(图文详解)
摘要: 不多说,直接上干货! 具体,见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章 使用决策树二元分类算法来预测分类StumbleUpon数据集
阅读全文
posted @ 2017-08-29 22:26 大数据和AI躺过的坑
阅读(361)
评论(0)
推荐(0)
Spark Mllib里如何删除每一条数据中所有的双引号“”(图文详解)
摘要: 不多说,直接上干货! 具体,见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章 使用决策树二元分类算法来预测分类StumbleUpon数据集
阅读全文
posted @ 2017-08-29 22:17 大数据和AI躺过的坑
阅读(817)
评论(0)
推荐(0)
Spark Mllib里如何将trainDara训练数据文件里第一行是字段名不是数据给删除掉(图文详解)
摘要: 不多说,直接上干货! 具体,见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章 使用决策树二元分类算法来预测分类StumbleUpon数据集
阅读全文
posted @ 2017-08-29 22:09 大数据和AI躺过的坑
阅读(373)
评论(0)
推荐(0)
Spark Mllib里如何将数据集按比例随机地分成trainData、testData和validationData数据集(图文详解)
摘要: 不多说,直接上干货! 具体详情见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第11章 电影推荐引擎
阅读全文
posted @ 2017-08-29 19:40 大数据和AI躺过的坑
阅读(1416)
评论(0)
推荐(0)
Exception in thread "main" java.lang.SecurityException: class "javax.servlet.FilterRegistration"'s signer information does not match signer information of other classes in the same package解决办法(图文详解)
摘要: 不多说,直接上干货! 问题详情 其实这个就是jvm的jdk版本问题 注意匹配好就是。 然后,成功
阅读全文
posted @ 2017-08-29 16:28 大数据和AI躺过的坑
阅读(6025)
评论(0)
推荐(0)
如何正确在IDEA 里maven构建的项目中引入lib的jar包(图文详解)
摘要: 不多说,直接上干货! 问题详情 以下是我,maven构建出来的最新spark2.2.0-bin-hadoop2.6的项目。 有些依赖包,maven还是无法一次性满足,所以,得手动加入lib的jar包。 其实,这原理很简单,跟hadoop项目是一样的。无非说maven构建项目方便下载jar包,但是也不
阅读全文
posted @ 2017-08-29 11:45 大数据和AI躺过的坑
阅读(9411)
评论(0)
推荐(1)
如何正确在IDEA 里非maven或非SBT构建的项目中引入lib的jar包(图文详解)
摘要: 以下是我,手动的一个项目 假设,大家,还需要导入 导入spark的jar包:是安装主目录下的jars所有jar包和examples/jars包。
阅读全文
posted @ 2017-08-29 11:41 大数据和AI躺过的坑
阅读(556)
评论(0)
推荐(0)
IDEA里运行代码时出现Caused by: java.lang.ClassNotFoundException: org.apache.log4j.Logger的解决办法(图文详解)
摘要: 不多说,直接上干货! 问题详情 运行出现log4j的问题 解决办法 在项目的pom.xml里添加如下的配置信息 当然,这版本,大家也可以选择个最新的稳定版本,我这里仅仅是个参考。
阅读全文
posted @ 2017-08-29 08:07 大数据和AI躺过的坑
阅读(36443)
评论(0)
推荐(0)
上一页
1
···
35
36
37
38
39
40
41
42
43
···
180
下一页
公告