摘要: 在Linux下安装Oracle软件之前,有相当工作需要准备,包括建立用户、配置内核参数、配置资源限制参数、配置Oracle用户环境等,十分繁琐。即便十分熟悉,也需要花费一定的精力来准备。说白了,做这些事情有点类似于低水平重复建设,虽没有多大技术含量,却又不得不做。现在将这些准备工作做成脚本,这样可以... 阅读全文
posted @ 2015-07-15 15:37 数据手艺人 阅读(409) 评论(0) 推荐(0)
摘要: 最近工作中,需对数据进行比对。在此之前,则需将数据导出。想到以前用过的spool命令,实验一番,分享如下:需建SQL执行脚本,内容如下:set feedback off --关掉行数显示set heading off --关掉标题行set termout off --关掉终端显示set ec... 阅读全文
posted @ 2015-07-15 15:28 数据手艺人 阅读(555) 评论(0) 推荐(0)
摘要: 在Oracle OCP考试中,相当一部分知识点涉及到对于Oracle常见函数的考查。尽管Oracle官方文档SQL Language Reference中Functions一章内列举了所有Oracle自带函数,但如果要系统的看一遍,还是要花费相当的精力,更何况还是英文呢。如果碰到一个不熟悉的,就查一... 阅读全文
posted @ 2015-07-15 15:21 数据手艺人 阅读(498) 评论(0) 推荐(0)
摘要: 因為開發需求,把對照表留下來一下。Chr(0)NullChr(29)分组符Chr(38)&Chr(48)0Chr(8)退格Chr(30)記錄分離符號Chr(39)‘Chr(49)1Chr(9)TabChr(31)單元分隔符號Chr(40)(Chr(50)2Chr(10)换行Chr(32)空格SPAC... 阅读全文
posted @ 2015-07-15 15:10 数据手艺人 阅读(2896) 评论(0) 推荐(0)
摘要: 同事最近在忙数据一致性比对工作,需要对不同文本文件中的数据进行比对,有的文件较大,记录较多,如果用普通的文本编辑器打开的话,很显然,会很卡,甚至打不开。基于此,可将该文本文件的数据导入到数据库中,在集合的层面进行比对。那么如何将文本文件的数据导入到数据库中呢?在这里,主要利用了Oracle的外部表特... 阅读全文
posted @ 2015-07-15 15:03 数据手艺人 阅读(1510) 评论(0) 推荐(0)
摘要: Hive 已是目前业界最为通用、廉价的构建大数据时代数据仓库的解决方案了,虽然也有 Impala 等后起之秀,但目前从功能、稳定性等方面来说,Hive 的地位尚不可撼动。其实这篇博文主要是想聊聊 SMB join 的,Join 是整个 MR/Hive 最为核心的部分之一,是每个 Hadoop/Hiv... 阅读全文
posted @ 2015-07-15 14:10 数据手艺人 阅读(783) 评论(2) 推荐(0)
摘要: 翻译Hive官方文档系列,文中括号中包含 注: 字样的,为我自行标注的,水平有限,翻译不是完美无缺的。如有疑问,请参照Hive官方文档对照查看。内容列表 Cloudera制作的Hive介绍视频 安装与配置 系统需求 安装Hive发行版 从Hive源码编译 运行Hive 配置管理概览 运行时配置 Hi... 阅读全文
posted @ 2015-07-15 10:19 数据手艺人 阅读(576) 评论(0) 推荐(0)