上一页 1 ··· 3 4 5 6 7 8 9 10 11 下一页
摘要: 数据库系统是软件领域的重要基础设施,而SQL优化器又是其重要组成部分。本文主要是对两个查询优化器,RBO: Rule-Based Optimization“基于规则的优化器”和CBO: Cost-Based Optimization“基于代价的优化器”进行概述性介绍。 阅读全文
posted @ 2020-12-27 22:46 JasonCeng 阅读(8982) 评论(0) 推荐(2) 编辑
摘要: 众所周知,微软官方推出的开源编辑器VSCode轻量、易用、美观(微软没有给我广告费哈^_^),在程序员界享有盛誉,今天就带着大家在Linux下快速下载并使用VCode编辑器。 阅读全文
posted @ 2020-12-24 07:51 JasonCeng 阅读(11448) 评论(0) 推荐(0) 编辑
摘要: 如果我们只有一台笔记本,又想要搭建一个小集群,怎么办?虚拟机帮你实现梦想,市面上较为常用的虚拟机软件有VMware、VirtualBox、Xen、KVM、hyper-v等,本文主要介绍如何在Linux下安装VMware,以为后续开启多个虚拟机,搭建小集群做准备。 阅读全文
posted @ 2020-12-24 06:52 JasonCeng 阅读(32130) 评论(2) 推荐(0) 编辑
摘要: 在Ubuntu16.04下安装截图工具的过程中发现PPA这个概念,于是进行了系统的学习,本文介绍PPA的概念、优势及使用方法。 阅读全文
posted @ 2020-12-20 23:03 JasonCeng 阅读(2728) 评论(0) 推荐(0) 编辑
摘要: 记录我在为SSD+机械硬盘的笔记本上安装Ubuntu16.04的全过程,主要是介绍手工分区需要注意的细节。 阅读全文
posted @ 2020-12-20 16:01 JasonCeng 阅读(1606) 评论(0) 推荐(0) 编辑
摘要: 新安装的Ubuntu16.04系统容易出现无法连接有线网络的问题,主要是因为网卡配置不完善,下面通过实操讲解如何解决该问题。 阅读全文
posted @ 2020-12-20 14:03 JasonCeng 阅读(1417) 评论(0) 推荐(0) 编辑
摘要: Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。 阅读全文
posted @ 2020-12-14 22:56 JasonCeng 阅读(235) 评论(0) 推荐(0) 编辑
摘要: 这是我在平时工作中分析spark程序报错以及性能问题时的一般步骤。当然,首先说明一下,以上分析步骤是基于企业级大数据平台,该平台会抹平很多开发难度,比如会有调度日志(spark-submit日志)、运维平台等加持,减少了开发人员直接接触生成服务器命令行的可能,从物理角度进行了硬控制,提高了安全性。下面我将带领大家从零到一,从取日志,到在Spark WebUI进行可视化分析相关报错、性能问题的方法。 阅读全文
posted @ 2020-10-12 16:52 JasonCeng 阅读(526) 评论(0) 推荐(0) 编辑
摘要: JSON是一种通用的存储格式,在半结构化存储中十分常见,部分场景已经开始存在以JSON格式贴源存储的数据,作为下游数据使用方,我们亟需对JSON格式的数据进行加工和处理,以提取出我们需要的数据,以对外提供更完善的数据服务。 阅读全文
posted @ 2020-09-28 14:11 JasonCeng 阅读(2929) 评论(0) 推荐(0) 编辑
摘要: YYYY-MM-DD与YYYYMMDD;hh-mm-ss与hhmmss的相互转换有两种办法,第一种是利用UNIX时间戳函数,第二种是利用字符串拼接函数。 阅读全文
posted @ 2020-08-23 09:50 JasonCeng 阅读(9343) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 下一页