博客园  :: 首页  :: 联系 :: 管理

2016年11月15日

该文被密码保护。 阅读全文

posted @ 2016-11-15 13:07 天戈朱 阅读(8) 评论(0) 推荐(0) 编辑

摘要: 当集群使用Azure Blog Storage时,prestoDB无法获取返回结果,在此记录下 如下,hive里面的两个表,一个使用的是本地的hdfs,一个是使用 azure blob storage, presto 能访问到hive里面的所有表结构,能查询本地hdfs的hive表,如下: 在返回查 阅读全文

posted @ 2016-11-15 09:41 天戈朱 阅读(541) 评论(0) 推荐(0) 编辑

2016年11月11日

摘要: Presto是一个运行在多台服务器上的分布式系统。 完整安装包括一个coordinator(调度节点)和多个worker。 由客户端提交查询,从Presto命令行CLI提交到coordinator。 coordinator进行解析,分析并执行查询计划,然后分发处理队列到worker 目录: 环境基本 阅读全文

posted @ 2016-11-11 19:18 天戈朱 阅读(9249) 评论(0) 推荐(0) 编辑

2016年11月8日

摘要: Presto 是 Facebook 推出的一个基于Java开发的大数据分布式 SQL 查询引擎,可对从数 G 到数 P 的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别,据称该引擎的性能是 Hive 的 10 倍以上。Presto 可以查询包括 Hive、Cassandra 甚至是一些商业 阅读全文

posted @ 2016-11-08 05:49 天戈朱 阅读(37343) 评论(1) 推荐(1) 编辑

2016年11月4日

该文被密码保护。 阅读全文

posted @ 2016-11-04 09:01 天戈朱 阅读(4) 评论(0) 推荐(0) 编辑

2016年10月19日

摘要: 数据作为信息的载体,要分析数据中包含的主要信息,即要分析数据的主要特征(即数据的数字特征), 对于数据的数字特征, 包含数据的集中位置、分散程度和数据分布,常用统计项目如下: 集中趋势统计量: 均值(Mean)、中位数(Median)、众数(Mode)、百分位数 离散趋势统计量:标准差(sd)、方差 阅读全文

posted @ 2016-10-19 05:33 天戈朱 阅读(4611) 评论(0) 推荐(0) 编辑

2016年10月13日

摘要: 目录: 数学函数 统计函数 应用示例 控制流 数学函数 ceiling(x): 大于等于 x 的最小整数, 如: ceiling(3.213) --> 4 floor(x): 小于等于 x 的最大整数,如: floor(3.6534) --> 3 trunc(x): 取x的整数部分, 如: trun 阅读全文

posted @ 2016-10-13 22:16 天戈朱 阅读(723) 评论(0) 推荐(0) 编辑

2016年10月12日

摘要: 目录: 创建新变量 变量重编码 日期值 数据排序 数据集合并 数据子集 随机取样 创建新变量 算术运算函数:x%%y 【求余 x mod y, 5%%2的结果为1】, x%/%y 【整数除法,5% / %2 结果为2】, ^或 ** 求幂 如下示例数据,在对象中增加平均、合计变量(场景不大合适,主要 阅读全文

posted @ 2016-10-12 21:20 天戈朱 阅读(582) 评论(0) 推荐(0) 编辑

2016年10月10日

摘要: 目录: 锂电池与锂离子电池 电池组成部分 电池参数 工作原理 充电过程 安全标准 电池衰老 锂电池、锂离子电池、锂聚合物电池 金属锂电池:跟普通干电池的原理一样,它是用金属锂作为负极,通过金属锂的腐蚀或叫氧化来产生电能的,这种电池循环性能不好,在充放电循环过程中容易形成锂结晶,造成内部短路,一般情况 阅读全文

posted @ 2016-10-10 21:28 天戈朱 阅读(1182) 评论(0) 推荐(0) 编辑

2016年10月9日

摘要: 目录: 图形示例 图形参数 符号、线条 颜色 文本属性 尺寸与边界 自定义标题 自定义坐标轴 图例 文本标注 图形组合 图形示例 如下代码描述病人对两种药物五个剂量水平上的响应情况 > mydata <- data.frame(dose=numeric(0),drugA=numeric(0),dru 阅读全文

posted @ 2016-10-09 20:34 天戈朱 阅读(1052) 评论(2) 推荐(1) 编辑