打赏

大数据和人工智能躺过的坑

我是一枚热衷技术的程序员，我是九月哥，每天都在路上！ 3个微信公众号：大数据躺过的坑、九哥九嫂小日子、今日热点在线 2个百家号：九哥九嫂小日子、九哥聊IT 欢迎您的加入，一起来探讨交流技术。目前重点研究Spring、Spring boot、Hadoop、HBase、Zookeeper、Flume、Kafka、Sqoop、Hive、Spark、Flink、Docker等，对Kettle二次开发有一定研究。

2017年8月30日

Spark Mllib里如何将预测结果如0或1，转换为文字描述来显示预测结果输出（图文详解）

摘要：不多说，直接上干货！具体，见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章使用决策树二元分类算法来预测分类StumbleUpon数据集阅读全文

posted @ 2017-08-30 09:43 大数据和AI躺过的坑阅读(474) 评论(0) 推荐(0)

2017年8月29日

Spark Mllib里如何将trainDara训练数据的分类特征字段转换为数值字段（图文详解）

摘要：不多说，直接上干货！字段3 是分类特征字段，但是呢，在分类算法里不能直接用。所以，必须要转换为数值字段才能够被分类算法使用。具体，见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章使用决策树二元分类算法来预测分类StumbleUpon数据集阅读全文

posted @ 2017-08-29 22:53 大数据和AI躺过的坑阅读(579) 评论(0) 推荐(0)

Spark Mllib里如何将trainDara训练数据文件里提取第M到第N字段（图文详解）

摘要：不多说，直接上干货！具体，见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章使用决策树二元分类算法来预测分类StumbleUpon数据集阅读全文

posted @ 2017-08-29 22:26 大数据和AI躺过的坑阅读(365) 评论(0) 推荐(0)

Spark Mllib里如何删除每一条数据中所有的双引号“”（图文详解）

摘要：不多说，直接上干货！具体，见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章使用决策树二元分类算法来预测分类StumbleUpon数据集阅读全文

posted @ 2017-08-29 22:17 大数据和AI躺过的坑阅读(819) 评论(0) 推荐(0)

Spark Mllib里如何将trainDara训练数据文件里第一行是字段名不是数据给删除掉（图文详解）

摘要：不多说，直接上干货！具体，见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章使用决策树二元分类算法来预测分类StumbleUpon数据集阅读全文

posted @ 2017-08-29 22:09 大数据和AI躺过的坑阅读(374) 评论(0) 推荐(0)

Spark Mllib里如何将数据集按比例随机地分成trainData、testData和validationData数据集（图文详解）

摘要：不多说，直接上干货！具体详情见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第11章电影推荐引擎阅读全文

posted @ 2017-08-29 19:40 大数据和AI躺过的坑阅读(1418) 评论(0) 推荐(0)

Exception in thread "main" java.lang.SecurityException: class "javax.servlet.FilterRegistration"'s signer information does not match signer information of other classes in the same package解决办法（图文详解）

摘要：不多说，直接上干货！问题详情其实这个就是jvm的jdk版本问题注意匹配好就是。然后，成功阅读全文

posted @ 2017-08-29 16:28 大数据和AI躺过的坑阅读(6027) 评论(0) 推荐(0)

如何正确在IDEA 里maven构建的项目中引入lib的jar包（图文详解）

摘要：不多说，直接上干货！问题详情以下是我，maven构建出来的最新spark2.2.0-bin-hadoop2.6的项目。有些依赖包，maven还是无法一次性满足，所以，得手动加入lib的jar包。其实，这原理很简单，跟hadoop项目是一样的。无非说maven构建项目方便下载jar包，但是也不阅读全文

posted @ 2017-08-29 11:45 大数据和AI躺过的坑阅读(9427) 评论(0) 推荐(1)

如何正确在IDEA 里非maven或非SBT构建的项目中引入lib的jar包（图文详解）

摘要：以下是我，手动的一个项目假设，大家，还需要导入导入spark的jar包：是安装主目录下的jars所有jar包和examples/jars包。阅读全文

posted @ 2017-08-29 11:41 大数据和AI躺过的坑阅读(558) 评论(0) 推荐(0)

IDEA里运行代码时出现Caused by: java.lang.ClassNotFoundException: org.apache.log4j.Logger的解决办法（图文详解）

摘要：不多说，直接上干货！问题详情运行出现log4j的问题解决办法在项目的pom.xml里添加如下的配置信息当然，这版本，大家也可以选择个最新的稳定版本，我这里仅仅是个参考。阅读全文

posted @ 2017-08-29 08:07 大数据和AI躺过的坑阅读(36454) 评论(0) 推荐(0)