会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Jesse_Li
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
3
4
5
6
7
8
9
10
下一页
2018年3月21日
数据仓库--数据质量
摘要: 大的归类三个方面: 一 数据质量 1 数据的完整性: 所有的所都符合BI业务需求。 2 数据的一致性: 经过数据清洗转化(ETL)能和数据源保持一致。 3 数据的精准性: 在不同的业务规则和业务情景下,值都是正确的。 二 数据性能:数据仓库能够给用户报表和不用的query提供好的性能 三 数据安全行
阅读全文
posted @ 2018-03-21 13:09 Jesse_Li
阅读(2666)
评论(0)
推荐(0)
2018年3月17日
MapReduce 调优-Combiner
摘要: 下图是演示了Combiner的好处 因为我们知道Hadoop的好处在于集群中有很多小的机器,组成了一个庞大的集群,把一个大的计算任务后者说复杂的计算过程分发到了一个个小的机器上面。但是这个集群一个致命或者是不好的就是大部分会花在磁盘IO上面,如果我们把这部分时间节省了,也就加快了MR的速度,因为Ma
阅读全文
posted @ 2018-03-17 18:06 Jesse_Li
阅读(170)
评论(0)
推荐(0)
MapReduce 详解
摘要: MapReduce的整个运行分为两个阶段: Map和Reduce Map阶段由一定数量的Map Task组成 输入格式的数据格式化:InputFormat 数日数据的处理:Mapper 数据分组:Partitioner 下面流程图: 1. Map task 首先从HDFS上Read文件,通过Inpu
阅读全文
posted @ 2018-03-17 17:42 Jesse_Li
阅读(170)
评论(0)
推荐(0)
2018年3月8日
Python 3.6 TypeEror: iter() returned non-iterator of type
摘要: 环境:Python 3.6 原因是 Python 3 中没有next(), 而是__next__(self) 代替
阅读全文
posted @ 2018-03-08 18:15 Jesse_Li
阅读(570)
评论(0)
推荐(0)
2018年3月7日
File "<ipython-input-20-ac8d4b51998e>"
摘要: 环境:Python 3.6 File "<ipython-input-20-ac8d4b51998e>", line 2 print "%s\t%s"%(word,"1") ^ SyntaxError: invalid syntax Root Case: Python3 语法错误,print后要跟(
阅读全文
posted @ 2018-03-07 13:59 Jesse_Li
阅读(1832)
评论(0)
推荐(0)
2018年3月6日
Jupyter 环境配置
摘要: 1. 找到python文件目录, 用管理员身份打开powershell python -m pip install jupyter 2. Jupyter notebook
阅读全文
posted @ 2018-03-06 18:04 Jesse_Li
阅读(195)
评论(0)
推荐(0)
2018年2月13日
gzip: stdin: not in gzip format tar: Child returned status 1. tar Error is not recoverable: exiting now
摘要: 最近在研究log4j。在Log4j官网下载了tar.gz.文件。解压时候出现错误。 1. wget https://www.apache.org/dyn/closer.lua/logging/log4j/2.10.0/apache-log4j-2.10.0-bin.tar.gz. 很顺利压缩包下载了
阅读全文
posted @ 2018-02-13 11:21 Jesse_Li
阅读(1575)
评论(0)
推荐(0)
2017年11月29日
Error: Duplicate key name 'PCS_STATS_IDX' (state=42000,code=1061) ----Hive schematool -initSchema -dbType mysql
摘要: schematool -initSchema -dbType mysqlMetastore connection URL: jdbc:mysql://localhost/metastore_db?createDatabaseIfNotExist=trueMetastore Connection Dr
阅读全文
posted @ 2017-11-29 10:54 Jesse_Li
阅读(5212)
评论(3)
推荐(2)
2017年11月9日
Hive 遇到 Class path contains multiple SLF4J bindings
摘要: Hive 遇到 Class path contains multiple SLF4J bindings Root Issue; slf4j在两处找到了jar包。分别是在Hadoop和hive的安装目录。 删除一个就好。
阅读全文
posted @ 2017-11-09 15:09 Jesse_Li
阅读(5700)
评论(0)
推荐(1)
ubuntu 重新启动 导致 Namenode无法启动
摘要: hadoop 单节点安装成功了之后,心情那是叫一个激动。不过后来不知道为什么系统相当的慢。于是就把系统重启了。但是不妙的是namenode各种无法启动。 原来的配置: core-site.xml hdfs-site.xml 网上搜了一圈原来是由于虚拟机的原来hdfs会自动创建自己的namenode和
阅读全文
posted @ 2017-11-09 14:36 Jesse_Li
阅读(428)
评论(0)
推荐(0)
上一页
1
···
3
4
5
6
7
8
9
10
下一页
公告