上一页 1 2 3 4 5 6 ··· 12 下一页
摘要: 写入到hive里 a1.sources = r1a1.sinks = k1a1.channels = c1# Describe/configure the sourcea1.sources.r1.type = execa1.sources.r1.channels = c1a1.sources.r1. 阅读全文
posted @ 2017-11-03 17:51 糖饼好吃 阅读(91) 评论(0) 推荐(0) 编辑
摘要: 核心: 在E:\python\Lib\site-packages(python的目录)新建pyspark.pth,里面写上E:\hadoop\spark-2.2.0-bin-hadoop2.7\python(spark中python的位置) 阅读全文
posted @ 2017-11-03 16:48 糖饼好吃 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 设置数据库连接 有助于性能的提升 阅读全文
posted @ 2017-10-20 15:46 糖饼好吃 阅读(86) 评论(0) 推荐(0) 编辑
摘要: 定时构建 每隔5分钟构建一次 1 2 每两小时构建一次 1 2 每天中午下班前定时构建一次 1 2 每天下午下班前定时构建一次 阅读全文
posted @ 2017-10-17 11:14 糖饼好吃 阅读(98) 评论(0) 推荐(0) 编辑
摘要: Kettle 命令行使用说明 1.Kitchen——作业执行器 是一个作业执行引擎,用来执行作业。这是一个命令行执行工具, 参数说明如下 1) -rep:Repositoryname 任务包所在存储名 2) -user:Repositoryusername 执行人 3) -pass:Reposito 阅读全文
posted @ 2017-10-17 10:06 糖饼好吃 阅读(10594) 评论(0) 推荐(0) 编辑
摘要: 背景:数据分析想看数据,就必须去各个平台把数据找出来放在EXCEL表中,然后通过透视表去进行统计,非常的耗时。 大概清楚自己要做什么了 将各个平台的数据存储到自己的数据库当中, 然后搭建自己公司的CRM(后台管理平台),对数据进行进一步的处理,比如各渠道获取的人数(微信、微博等)能展现出一个图表,之 阅读全文
posted @ 2017-10-12 16:23 糖饼好吃 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 利用Kettle转储接口数据 转自:http://www.cnblogs.com/surinfo/p/6692610.html 有小部分备注 1. 项目背景 1.1. 项目背景 数据接口 API:应用程序接口(Application Program Interface)的简称,是实现计算机软件之间数 阅读全文
posted @ 2017-09-21 14:22 糖饼好吃 阅读(3950) 评论(0) 推荐(0) 编辑
摘要: 在kettle目录下执行 ./pan.sh /file:/tang/222.ktr 在资源库中执行 ./kitchen.sh -rep=kettle1 -user=admin -pass=admin -level=Basic -job=job http://blog.csdn.net/lan1233 阅读全文
posted @ 2017-09-20 16:06 糖饼好吃 阅读(264) 评论(0) 推荐(0) 编辑
摘要: Pandas: 透视表 pivot_table(df,index,values) 阅读全文
posted @ 2017-06-23 15:38 糖饼好吃 阅读(157) 评论(0) 推荐(0) 编辑
摘要: 下面全面是对Oracle系统表的一些介绍: 数据字典dict总是属于Oracle用户sys的。 1、用户: select username from dba_users; 改口令 alter user spgroup identified by spgtest; 2、表空间: select * fr 阅读全文
posted @ 2017-06-20 17:24 糖饼好吃 阅读(144) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 12 下一页