会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
爱知菜的技术博客
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
10
11
12
13
14
15
16
17
18
···
42
下一页
2018年5月18日
Hive UDF 环境搭建(Eclipse+Maven)
摘要: 安装Maven (https://blog.csdn.net/rav009/article/details/79469303)安装Eclipse安装Eclipse的Maven插件 m2e 使用Eclipse创建Maven项目 Group ID一般是org.yourname.projectname,
阅读全文
posted @ 2018-05-18 17:37 爱知菜
阅读(87)
评论(0)
推荐(0)
2018年5月16日
Hadoop/Hive 疑难杂症
摘要: 1. namenode is in safe mode, 使用下面命令行离开safe mode: hadoop dfsadmin -safemode leave 2. Container [pid=22826,containerID=container_1526436506350_0003_01_0
阅读全文
posted @ 2018-05-16 13:24 爱知菜
阅读(55)
评论(0)
推荐(0)
2018年5月15日
向HIVE导入windows平台(dos类型)的日志
摘要: 把windows的日志复制到linux目录下, 可以先用file,head,tail等命令查看文件概况. 使用dos2unix命令将文件转成unix格式 由于HIVE的时间类型只支持timestamp(hive中timestamp的格式是"YYYY-MM-DD HH:MM:SS"), 所以我们要把日
阅读全文
posted @ 2018-05-15 11:58 爱知菜
阅读(25)
评论(0)
推荐(0)
2018年5月11日
Virtualbox 为ubuntu增加硬盘空间 分区
摘要: 扩容 VBoxManage.exe 这个exe文件可以对各类虚拟机的vdi, vmdk文件进行操作 在CMD中执行 # 查看信息 "D:\Program Files\Oracle\VirtualBox\VBoxManage.exe" showhdinfo "E:\Ubuntu Virtual Dis
阅读全文
posted @ 2018-05-11 21:02 爱知菜
阅读(28)
评论(0)
推荐(0)
2018年5月10日
Pentaho Kettle 连接 Hive2 进行 ETL 的总结
摘要: 复制驱动: 首先在Hive的安装目录里找到Hive的jdbc jar文件. 比如 hive/apache-hive-2.3.2-bin/jdbc/hive-jdbc-2.3.2-standalone.jar. 复制这个jar文件到Kettle的lib目录下, 比如 /Kettle/data-inte
阅读全文
posted @ 2018-05-10 18:28 爱知菜
阅读(62)
评论(0)
推荐(0)
2018年4月20日
HDFS, YARN, HBase, Hive, ZooKeeper端口说明
摘要: 件节点默认端口配置用途说明HDFSDataNode50010dfs.datanode.addressdatanode服务端口,用于数据传输HDFSDataNode50075dfs.datanode.http.addresshttp服务的端口HDFSDataNode50475dfs.datanode.
阅读全文
posted @ 2018-04-20 16:08 爱知菜
阅读(32)
评论(0)
推荐(0)
2018年4月19日
Ubuntu16.04 伪分布模式 HBase搭建
摘要: 仅针对伪分布模式, 即单节点 解压缩下载的编译好的安装包 tar -xzvf hbase-1.2.6-bin.tar.gz -C /opt 修改hbase安装目录的conf文件夹下的hbase-site.xml <configuration> <property> <name>hbase.rootd
阅读全文
posted @ 2018-04-19 16:52 爱知菜
阅读(33)
评论(0)
推荐(0)
2018年4月13日
Hive Map side join AND Reduce side join
摘要: map-side join: map-side join顾名思义就是join的动作在map阶段完成, 不必动用reducer. 但是要用上map-side join必须满足的条件是两个join的表, 必须有一个足够小. 小到可以使用 Hadoop的 DistributedCache 功能把小表缓存到
阅读全文
posted @ 2018-04-13 16:52 爱知菜
阅读(46)
评论(0)
推荐(0)
2018年4月9日
Hive HQL 操作总结
摘要: hive 的log path(linux) 在 /tmp/username/ 调用hive: hive -f script.sql hive -e 'select * from table' hive --config /user/another/config/directory hive -hiv
阅读全文
posted @ 2018-04-09 17:05 爱知菜
阅读(41)
评论(0)
推荐(0)
2018年3月23日
使用命令行部署 sqlserver dacpac 文件
摘要: "C:\Program Files (x86)\Microsoft SQL Server\110\DAC\bin\SqlPackage.exe" /TargetServerName:"localhost" /SourceFile:"database.dacpac" /TargetDatabaseNa
阅读全文
posted @ 2018-03-23 14:57 爱知菜
阅读(28)
评论(0)
推荐(0)
上一页
1
···
10
11
12
13
14
15
16
17
18
···
42
下一页
公告