会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
IT界的一名小学生
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
下一页
2020年11月1日
<console>:29: error: overloaded method value join with alternatives:(right: org.apache.spark.sql.Dataset[_],joinExprs: org.apache.spark.sql.Column)org.apache.spark.sql.DataFrame <and>
摘要: 在scala中执行如下代码,报 join 错误!! scala> val data = itemTotalTime.join(totalTime, "userId") 错误日志如下: <console>:29: error: overloaded method value join with alt
阅读全文
posted @ 2020-11-01 23:21 IT界的一名小学生
阅读(1079)
评论(0)
推荐(0)
2020年10月25日
scala中的:: , +:, :+, :::, +++, 等操作的含义
摘要: package test /** * scala中的:: , +:, :+, :::, +++, 等操作; */ object listTest { def main(args: Array[String]): Unit = { val list = List(1,2,3) // :: 用于的是向队
阅读全文
posted @ 2020-10-25 17:42 IT界的一名小学生
阅读(999)
评论(0)
推荐(0)
2020年10月3日
四、大数据组件之Hive--UDF使用详细介绍(包含demo)
摘要: Hive 的udf使用 1.Hive 的udf使用需用需要的依赖 hadoop-common-2.6.4.jar hive-exec-1.2.1.jar <!--直接添加上面的两个jar包或者在pom中直接引入下面的两个依赖,都行--> <dependency> <groupId>org.apach
阅读全文
posted @ 2020-10-03 17:28 IT界的一名小学生
阅读(1184)
评论(0)
推荐(0)
2020年9月5日
三、大数据组件之Yarn
摘要: YARN YARN是Hadoop 2.0中的资源管理系统,它的基本设计思想是将MRv1中的JobTracker拆分成了两个独立的服务:一个全局的资源管理器ResourceManager和每个应用程序特有的ApplicationMaster。其中ResourceManager负责整个系统的资源管理和分
阅读全文
posted @ 2020-09-05 17:28 IT界的一名小学生
阅读(339)
评论(0)
推荐(0)
四、大数据组件之Hive--创建表
摘要: Create Table 官网说明 Hive建表方式共有三种: 直接建表法 查询建表法 like建表法 首先看官网介绍’[]’ 表示可选,’|’ 表示二选一 1 CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_n
阅读全文
posted @ 2020-09-05 17:26 IT界的一名小学生
阅读(895)
评论(0)
推荐(0)
2020年8月12日
K-Means(聚类)
摘要: 说到聚类,应先理解聚类和分类的区别,很多业务人员在日常分析时候不是很严谨,混为一谈,其实二者有本质的区别。 分类:分类其实是从特定的数据中挖掘模式,作出判断的过程。比如Gmail邮箱里有垃圾邮件分类器,一开始的时候可能什么都不过滤,在日常使用过程中,我人工对于每一封邮件点选“垃圾”或“不是垃圾”,过
阅读全文
posted @ 2020-08-12 17:02 IT界的一名小学生
阅读(486)
评论(0)
推荐(0)
2020年8月11日
Anaconda详细安装及使用教程(带图文)
摘要: Anacond的介绍 Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。 因为包含了大量的科学包,Anaconda 的下载文件比较大(约 531 MB),如果只需要某些包,或者需要节省带宽或存储空间,也可以使用Miniconda这个较
阅读全文
posted @ 2020-08-11 15:08 IT界的一名小学生
阅读(19254)
评论(1)
推荐(2)
使用Anaconda下载的python解析器关联pyCharm 无效问题
摘要: 今天刚下载了 Anaconda ,然后又基于Anaconda 下载虚拟的python3.7版, 按照里说应该替换一下pyCharm 里面之前关联的物理机真实的python 就可以正常使用了,但是替换完无效,如 numpy 这些包还是报错,具体解决如下: 上面这个图是解决问题之后的模样;解决前要先点击
阅读全文
posted @ 2020-08-11 15:04 IT界的一名小学生
阅读(791)
评论(0)
推荐(0)
Collecting package metadata (current_repodata.json): failed
摘要: 当在windows下面的Anaconda的命令行中运行 conda update --all 时,如果出现Collecting package metadata (current_repodata.json): failed的错误提示, 可以按照下面的方式来解决掉: 把路径“../Anaconda3
阅读全文
posted @ 2020-08-11 10:48 IT界的一名小学生
阅读(17514)
评论(4)
推荐(4)
Anaconda中的python出现“ModuleNotFoundError: No module named numpy”错误
摘要: 望图解释报错: 在报 “ModuleNotFoundError: No module named numpy ” 错误的之前,调试conda的时候还报了一个 “import 不是内部或者外部命令” 问题 如上图 我执行完 1 命令之后就误以为是进入了python 环境,其实不然,还需要执行 2 命令
阅读全文
posted @ 2020-08-11 10:44 IT界的一名小学生
阅读(3886)
评论(0)
推荐(0)
上一页
1
2
3
4
下一页
公告