2017 年 8月 29 日随笔档案 - 大数据和AI躺过的坑

2017年8月29日

Spark Mllib里如何将trainDara训练数据的分类特征字段转换为数值字段（图文详解）

摘要：不多说，直接上干货！字段3 是分类特征字段，但是呢，在分类算法里不能直接用。所以，必须要转换为数值字段才能够被分类算法使用。具体，见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章使用决策树二元分类算法来预测分类StumbleUpon数据集阅读全文

posted @ 2017-08-29 22:53 大数据和AI躺过的坑阅读(579) 评论(0) 推荐(0)

Spark Mllib里如何将trainDara训练数据文件里提取第M到第N字段（图文详解）

摘要：不多说，直接上干货！具体，见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第13章使用决策树二元分类算法来预测分类StumbleUpon数据集阅读全文

posted @ 2017-08-29 22:26 大数据和AI躺过的坑阅读(365) 评论(0) 推荐(0)

Spark Mllib里如何删除每一条数据中所有的双引号“”（图文详解）

posted @ 2017-08-29 22:17 大数据和AI躺过的坑阅读(819) 评论(0) 推荐(0)

Spark Mllib里如何将trainDara训练数据文件里第一行是字段名不是数据给删除掉（图文详解）

posted @ 2017-08-29 22:09 大数据和AI躺过的坑阅读(374) 评论(0) 推荐(0)

Spark Mllib里如何将数据集按比例随机地分成trainData、testData和validationData数据集（图文详解）

摘要：不多说，直接上干货！具体详情见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的第11章电影推荐引擎阅读全文

posted @ 2017-08-29 19:40 大数据和AI躺过的坑阅读(1418) 评论(0) 推荐(0)

Exception in thread "main" java.lang.SecurityException: class "javax.servlet.FilterRegistration"'s signer information does not match signer information of other classes in the same package解决办法（图文详解）

摘要：不多说，直接上干货！问题详情其实这个就是jvm的jdk版本问题注意匹配好就是。然后，成功阅读全文

posted @ 2017-08-29 16:28 大数据和AI躺过的坑阅读(6027) 评论(0) 推荐(0)

如何正确在IDEA 里maven构建的项目中引入lib的jar包（图文详解）

摘要：不多说，直接上干货！问题详情以下是我，maven构建出来的最新spark2.2.0-bin-hadoop2.6的项目。有些依赖包，maven还是无法一次性满足，所以，得手动加入lib的jar包。其实，这原理很简单，跟hadoop项目是一样的。无非说maven构建项目方便下载jar包，但是也不阅读全文

posted @ 2017-08-29 11:45 大数据和AI躺过的坑阅读(9427) 评论(0) 推荐(1)

如何正确在IDEA 里非maven或非SBT构建的项目中引入lib的jar包（图文详解）

摘要：以下是我，手动的一个项目假设，大家，还需要导入导入spark的jar包：是安装主目录下的jars所有jar包和examples/jars包。阅读全文

posted @ 2017-08-29 11:41 大数据和AI躺过的坑阅读(558) 评论(0) 推荐(0)

IDEA里运行代码时出现Caused by: java.lang.ClassNotFoundException: org.apache.log4j.Logger的解决办法（图文详解）

摘要：不多说，直接上干货！问题详情运行出现log4j的问题解决办法在项目的pom.xml里添加如下的配置信息当然，这版本，大家也可以选择个最新的稳定版本，我这里仅仅是个参考。阅读全文

posted @ 2017-08-29 08:07 大数据和AI躺过的坑阅读(36455) 评论(0) 推荐(0)

IDEA里运行代码时出现Error:scalac: error while loading JUnit4, Scala signature JUnit4 has wrong version expected: 5.0 found: 4.1 in JUnit4.class错误的解决办法（图文详解）

摘要：不多说，直接上干货！问题详情当出现这类错误时是由于版本不匹配造成的解决办法如果你想快速运行的话，就用idea建立的maven项目生成的几个test类和对象注释掉，或者删除掉即可运行。然后，运行即可。当然，上面的这种方法不是最彻底的。 File -> settings -> Editor 阅读全文

posted @ 2017-08-29 07:59 大数据和AI躺过的坑阅读(3452) 评论(0) 推荐(0)

大数据和人工智能躺过的坑

公告