欢迎来到ThinkDifferent的博客

坚持!
摘要: 题目一:create table etltable( name varchar(20) , seq int, money int); create table etltarget ( name varchar(20), min_s int, max_s int, sum_money int); in 阅读全文
posted @ 2020-03-23 15:56 ThinkDifferent 阅读(469) 评论(0) 推荐(0) 编辑
摘要: 1. 概述 1.1 hive的特征: 可以通过SQL轻松访问数据的工具,从而实现数据仓库任务,如提取/转换/加载(ETL),报告和数据分析; 它可以使已经存储的数据结构化; 可以直接访问存储在Apache HDFS或其他数据存储系统(如Apache HBase)中的文件; Hive除了支持MapRe 阅读全文
posted @ 2020-03-23 01:09 ThinkDifferent 阅读(390) 评论(0) 推荐(0) 编辑
摘要: 1. What is a logical data mapping and what does it mean to the ETL team?什么是逻辑数据映射?它对ETL项目组的作用是什么? 答:逻辑数据映射(Logical Data Map)用来描述源系统的数据定义、目标数据仓库的模型以及将源 阅读全文
posted @ 2020-03-17 21:11 ThinkDifferent 阅读(698) 评论(0) 推荐(0) 编辑
摘要: 1. 什么叫数据仓库?数据仓库的特点?(相信inmon的数据仓库概念的四个特点是最基本的吧,当然需要加上自己的理解)首先,用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修 阅读全文
posted @ 2020-03-14 20:15 ThinkDifferent 阅读(1476) 评论(0) 推荐(0) 编辑
摘要: 数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流入 阅读全文
posted @ 2020-03-14 19:18 ThinkDifferent 阅读(627) 评论(0) 推荐(0) 编辑
摘要: [TOC] 常用命令 1. 上传、下载 上传文件:rz,然后回车弹出上传文件界面 ; 下载文件:sz 文件名 ; 2. 删除文件和文件夹 删除文件:rm f 文件名 删除文件夹(同时删除文件夹里的内容): rm rf 文件夹名 3. 目录操作 新建目录:mkdir 文件夹名称 重命名目录: mv f 阅读全文
posted @ 2020-01-12 22:10 ThinkDifferent 阅读(268) 评论(0) 推荐(0) 编辑
摘要: 1. 问题描述 在同步数据时常常会发现一个错误: 将截断字符串或二进制数据 。 2. 问题原因 这个问题出现的原因是:要插入的数值字段的长度超出了数据库中字段的长度。比如:插入的字符串字节长度是40,数据库中字段长度设置为了varchar(36)就会报此错误。 3.问题扩展 a. 如何计算字符串长度 阅读全文
posted @ 2020-01-05 19:41 ThinkDifferent 阅读(2995) 评论(0) 推荐(0) 编辑
摘要: 在1月10日的数据侠实验室中,DT君邀请到第一财经商业数据中心(CBNData)的高级数据分析师王晴雯,她用阿里大数据为大家解密了90、95后的“钱兜”与“海淘购物船”。 跨境电商飞速发展,碾压“人肉代购” 跨境消费已然成为热潮,相信大家都有过“海淘”的经历。2017年最后一天,最后一批90后也已经 阅读全文
posted @ 2018-11-15 10:38 ThinkDifferent 阅读(834) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-10-11 17:44 ThinkDifferent 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 第一步:在PyCharm菜单中选择File >Settings 第二步:在设置页出现的搜索框搜索:Project Interpreter 或者直接定位到此处 第三步:输入库名,搜索安装第三方库,等待安装完成。在安装完成后PyCharm会有成功提示。 扩展:第二步界面处可以看本机安装了哪些第三方库。点 阅读全文
posted @ 2018-08-09 15:53 ThinkDifferent 阅读(370) 评论(0) 推荐(0) 编辑