随笔分类 - 数据库笔记
摘要:####《SQL进阶教程》是一本讲解标准SQL的进阶书籍,书中大部分内容都来自作者记录自己实践总结和日常思考的个人博客,最大的特点是理论与实践相结合,除了讲述应该怎么做,还解释了其背后的原理,豆瓣评分9.5,非常值得一读。
阅读全文
摘要:1.只选择使用必要的字段 由于采用列式存储,选择需要的字段可加快字段的读取、减少数据量。避免采用*读取所有字段 -- 正确的写法 SELECT id,name FROM users -- 错误的写法 SELECT * FROM users 2.过滤条件必须加上分区字段 -- 正确的写法 select
阅读全文
摘要:相比Windows系统,Linux系统上安装MySQL比较简单,本文将详细介绍如何在Ubuntu系统安装MySQL。 PART 1 安装MySQL 1.更新软件源 sudo apt update 2.安装MySQL sudo apt-get install mysql-server sudo apt
阅读全文
摘要:MYSQL优化方法 设计:存储引擎,字段类型,范式与逆范式 功能:索引,缓存,分区分表。 架构:主从复制,读写分离,负载均衡。 合理SQL:测试,经验。 一、选择合理的存储引擎 存储引擎是一种用来存储MySQL中对象(记录和索引)的一种特定的结构(文件结构),处于MySQL服务器的最底层,直接存储数
阅读全文
摘要:列名为主键,count(列名)会比count(1)快。 列名不为主键,count(1)会比count(列名)快。 如果表多个列并且没有主键,则count(1)的执行效率优于count(*)。 如果有主键,则count主键)的执行效率是最优的。 如果表只有一个字段,则count(*)最优。 count
阅读全文
摘要:es是基于Apache Lucene的开源分布式(全文)搜索引擎,,提供简单的RESTful API来隐藏Lucene的复杂性。特点: 1、分布式的实时文件存储,每个字段都被索引并可被搜索 2、分布式的实时分析搜索引擎 3、可以扩展到成百上千台服务器,处理PB级结构化或非结构化数据。 建立es连接
阅读全文
摘要:一、数据采集和传输层 Flume Flume一个分布式、可靠的、高可用的用于数据采集、聚合和传输的系统。常用于日志采集系统中,支持定制各类数据发送方用于收集数据、通过自定义拦截器对数据进行简单的预处理并传输到各种数据接收方如HDFS、HBase、Kafka中。之前由Cloudera开发,后纳入Apa
阅读全文
摘要:zepplin中使用presto %presto -- 用户信息查询 select id,name,phone,age from biz.users presto正则表达式 -- 查询中文 select regexp_extract(ext,'[\u4e00-\u9fa5]+') -- 查询电话号码
阅读全文

浙公网安备 33010602011771号