摘要: 数据可视化是数据分析或机器学习项目中十分重要的一环。通常,你需要在项目初期进行探索性的数据分析(EDA),从而对数据有一定的了解,而且创建可视化确实可以使分析的任务更清晰、更容易理解,特别是对于大规模的高维数据集。在项目接近尾声时,以一种清晰、简洁而引人注目的方式展示最终结果也是非常重要的,让你的受 阅读全文
posted @ 2019-01-05 23:16 海东潮 阅读(1044) 评论(0) 推荐(0)
摘要: 一、原因分析一般而言,slave相对master延迟较大,其根本原因就是slave上的复制线程没办法真正做到并发。简单说,在master上是并发模式(以InnoDB引擎为主)完成事务提交的,而在slave上,复制线程只有一个sql thread用于binlog的apply,所以难怪slave在高并发 阅读全文
posted @ 2019-01-05 22:18 海东潮 阅读(1014) 评论(0) 推荐(0)
摘要: 不可见索引允许您将索引标记为查询优化器不可用。MySQL维护不可见索引,并在与索引关联的列中的数据发生更改时使其保持最新。 默认情况下,索引是可见的。要使它们不可见,您必须在创建时或使用ALTER TABLE命令显式声明其可见性。MySQL为我们提供了维护索引可见性的关键字VISIBLE和INVIS 阅读全文
posted @ 2019-01-05 20:47 海东潮 阅读(1194) 评论(0) 推荐(0)
摘要: 将运行中的大表修改为分区表 本文章代码仅限于以数据时间按月水平分区,其他需求可自行修改代码实现 1. 创建一张分区表 这张表的表字段和原表的字段一摸一样,附带分区 1 2 3 4 5 6 7 8 9 10 11 12 CREATE TABLE `metric_data_tmp` ( id bigin 阅读全文
posted @ 2019-01-05 10:41 海东潮 阅读(1501) 评论(0) 推荐(0)
摘要: 一、从常见的报错说起 故事的开头我们先来看一个常见的sql报错信息: 相信对于这类报错大家一定遇到过很多次了,特别对于OMG这种已内容生产为主要工作核心的BG,在内容线的存储中,数据大一定是个绕不开的话题。这里的数据“大”,远不止存储空间占用多,其中也包括了单个(表)字段存储多、大,数据留存时间长, 阅读全文
posted @ 2019-01-05 10:37 海东潮 阅读(4198) 评论(0) 推荐(0)