会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
xiaojy
博客园
首页
新随笔
联系
订阅
管理
2022年1月10日
Kettle安装配置-kettle-8.2.0-Centos7
摘要: 一、环境准备 二、下载安装 三、运行软件 四、核心文件配置 五、在Linux上运行 六、服务器定时运行Job 一、环境准备 1.1 Centos7 1.2 创建用户 $ useradd -m -g bigdata etl -s /bin/bash # ll /home/查看是否创建成功 $ pass
阅读全文
posted @ 2022-01-10 09:46 xiaojy
阅读(3642)
评论(0)
推荐(0)
2021年11月26日
我的Kettle学习笔记(3)—时间维度表创建
摘要: 本案例基于kettle8.2 ,以sakila_dwh案例为素材,相关数据网络下载 一、流程图 二、生成小时、分钟、秒数据 1,新建转换-输入-生成记录,步骤名称为“生成小时” 2,复制两次上述步骤,分别命名为“生成分”、“生成秒” 3,按以下标记输入内容: (1)生成时: (2)生成分: (3)生
阅读全文
posted @ 2021-11-26 16:39 xiaojy
阅读(806)
评论(0)
推荐(0)
2021年11月17日
我的Kettle学习笔记(2)—日期维度表创建
摘要: 一、流程图 二、生产10年日期记录 1,新建转换-输入-生成记录 2,生产初始日期,在字段按以下格式输入“initial_date” 三、增加日期序列 1,点击“转换-增加序列” 2,定义值的名称为“DaySquence” 四、生成日期属性 1,点击“脚本-JavaScript代码” 2,将以下代码
阅读全文
posted @ 2021-11-17 17:27 xiaojy
阅读(969)
评论(0)
推荐(0)
2021年11月12日
我的Kettle学习笔记(1) - 数据抽取
摘要: 一、内容大纲 1,文本文件抽取 二、文本文件抽取 2.1 流程图 2.2 操作流程 2.2.1 文本文件输入 1, 在转换-输入中选择‘文本文件输入’ 2, 进入菜单,在‘文件’输入文件路径(如果要合并文件夹内数据,输入文件夹路径并填写正则表达式) 3, 进入‘内容’选项: 输入文件类型; 填写分割
阅读全文
posted @ 2021-11-12 11:39 xiaojy
阅读(614)
评论(0)
推荐(0)
2021年11月11日
Hive表分类—内部表、外部表、分区表、桶表和视图
摘要: 一、内部表 ###1.1 基本操作 1.1.1, 是最简单的一种表,相当于是MySQL中的表,是将数据保存到Hive自己的数据仓库中,同时会在HDFS中创建对应目录,默认路径为/user/hive/warehous; 1.1.2, 创建一个员工信息表: create table emp (empno
阅读全文
posted @ 2021-11-11 18:00 xiaojy
阅读(182)
评论(0)
推荐(0)
2021年11月8日
matplotlib笔记(2)— 数据标签
摘要: 一、添加数据标签 使用的是plt.text for x,y in zip(X,Y): plt.text(x, y+0.5, '%.0f' % y, ha='center', va= 'bottom',fontsize=11) X为横轴、Y为纵轴数据,y+0.5表示向上平移动0.5
阅读全文
posted @ 2021-11-08 10:28 xiaojy
阅读(115)
评论(0)
推荐(0)
2021年11月5日
PowerBI常用笔记(1)-添加日期表
摘要: Date = var firstYear=YEAR(min(SaleByMonth[sale_date_yymmdd])) return ADDCOLUMNS(FILTER(CALENDARAUTO(),YEAR([Date])>=firstYear), "year",DATE(YEAR([Date
阅读全文
posted @ 2021-11-05 09:21 xiaojy
阅读(535)
评论(0)
推荐(0)
2021年10月21日
matplotlib笔记(1)—分类颜色、标记和线条
摘要: 一、格式字符串由颜色、标记和线条部分组成: fmt = '[marker][line][color]' 它们中的每一个都是可选的。如果未提供,则使用样式循环中的值。例外:如果line给出,但没有marker,数据将是一条没有标记的线。 [color][marker][line]也支持其他组合,但请注
阅读全文
posted @ 2021-10-21 11:48 xiaojy
阅读(435)
评论(0)
推荐(0)
2021年8月24日
Flink 集群安装配置-Centos7
摘要: 一、下载安装 二、文件配置 三、启动Flink 一、下载安装 1.1 下载地址:https://archive.apache.org/dist/flink,此处下载的文件是 flink-1.7.2-bin-hadoop27-scala_2.11.tgz 1.2 解压缩 进入文件目录 tar -zxv
阅读全文
posted @ 2021-08-24 16:54 xiaojy
阅读(620)
评论(0)
推荐(0)
2021年8月22日
zepplin-0.9安装配置-Centos7
摘要: 一 下载安装 二 文件配置 三 启动Zeppelin 四 用户管理 五 数据源设置 六 interpreter设置 一、下载安装 1.1 下载地址:http://zeppelin.apache.org/download.html 下载页面会提供两种二进制包: zeppelin-0.9.0-bin-n
阅读全文
posted @ 2021-08-22 14:40 xiaojy
阅读(385)
评论(0)
推荐(0)
下一页
公告