张永清

2024年5月3日

摘要：扫描图书前言中的如下图所示的二维码，即可进入到下载页面。 -> 关注清哥聊技术公众号，了解更多技术文章如下图所示即为课件的下载页面，免费提供下载阅读全文

posted @ 2024-05-03 12:59 张永清阅读(261) 评论(0) 推荐(0)

2024年5月2日

《软件性能测试、分析与调优实践之路》(第2版)--第7章节选--常见性能问题分析总结

摘要： 1. 性能指标曲线频繁出现大幅度抖动 -> 关注清哥聊技术公众号，了解更多技术文章如图7-5-1所示，TPS和平均响应时间出现频繁的上下抖动。频繁抖动说明系统并不是一直在稳定地运行，中间会有短暂的停顿，就是持续运行了一段时间后，马上会停顿一下，然后又继续运行，持续地这样交替进行，造成了系统的频繁剧阅读全文

posted @ 2024-05-02 12:24 张永清阅读(583) 评论(0) 推荐(0)

2024年3月3日

【学习性能分析--第二版】如何做好性能测试分析诊断调优-暨《软件性能测试、分析与调优实践之路》(第2版)推荐

摘要：【推荐序】-> 关注清哥聊技术公众号，了解更多技术文章 1999年，Windows 98只有1800万行代码，运行环境只需要16MB内存、225MB硬盘。而目前最新的Windows 10有6000万行代码，需要8GB内存、20GB硬盘才能流畅地运行。1990年，低速的CAN总线才125kb/s，高速阅读全文

posted @ 2024-03-03 17:50 张永清阅读(535) 评论(0) 推荐(3)

2023年10月30日

springcloud/springboot集成NACOS 做注册和配置中心以及nacos源码分析

摘要：一、SpringCloud 简介 -> 关注清哥聊技术公众号，了解更多技术文章 Spring Cloud 是一系列框架的有序集合如服务发现注册、配置中心、消息总线、负载均衡、熔断器、数据监控等。 SpringCloud 将多个服务框架组合起来，通过Spring Boot进行再封装，屏蔽掉了复杂的配置阅读全文

posted @ 2023-10-30 14:38 张永清阅读(4633) 评论(0) 推荐(0)

2023年10月27日

Springboot+Mybatis+Mybatisplus 框架中增加自定义分页插件和sql 占位符修改插件

摘要：一、Springboot简介 -> 关注清哥聊技术公众号，了解更多技术文章 springboot 是当下最流行的web 框架，Spring Boot是由Pivotal团队提供的全新框架，其设计目的是用来简化新Spring应用的初始搭建以及开发过程。该框架使用了特定的方式来进行配置，从而使开发人员不再阅读全文

posted @ 2023-10-27 17:04 张永清阅读(1299) 评论(0) 推荐(0)

2022年11月11日

MySQL数据库的性能分析 ---图书《软件性能测试分析与调优实践之路》-手稿节选

摘要： 1 、MySQL数据库的性能监控 1.1、如何查看MySQL数据库的连接数 -> 关注清哥聊技术公众号，了解更多技术文章连接数是指用户已经创建多少个连接，也就是MySQL中通过执行 SHOW PROCESSLIST命令输出结果中运行着的线程个数的详情，如图所示。 SHOW PROCESSLIST默阅读全文

posted @ 2022-11-11 15:56 张永清阅读(1202) 评论(0) 推荐(0)

2022年9月29日

使用grafana+Prometheus监控时PromQL内置函数详解

摘要： 1、Prometheus简介 -> 关注清哥聊技术公众号，了解更多技术文章 Prometheus(中文名:普罗米修斯)是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB). Prometheus使用Go语言开发, 是Google BorgMon监控系统的开源版本。 Prometh 阅读全文

posted @ 2022-09-29 10:32 张永清阅读(6753) 评论(0) 推荐(0)

2022年6月7日

如何扩展Spark Catalyst,抓取spark sql 语句，通过listenerBus发送sql event以及编写自定义的Spark SQL引擎

摘要： 1、Spark Catalyst扩展点 -> 关注清哥聊技术公众号，了解更多技术文章 Spark catalyst的扩展点在SPARK-18127中被引入，Spark用户可以在SQL处理的各个阶段扩展自定义实现，非常强大高效，是SparkSQL的核心组件(查询优化器)，它负责将SQL语句转换成物理执阅读全文

posted @ 2022-06-07 13:55 张永清阅读(1017) 评论(0) 推荐(0)

2022年6月3日

软件性能测试分析与调优实践之路-JMeter对RPC服务的性能压测分析与调优-手稿节选

摘要：一、JMeter 如何通过自定义Sample来压测RPC服务 -> 关注清哥聊技术公众号，了解更多技术文章 RPC（Remote Procedure Call）俗称远程过程调用，是常用的一种高效的服务调用方式，也是性能压测时经常遇到的一种服务调用形式。常见的RPC有GRPC、Thrift、Dubbo 阅读全文

posted @ 2022-06-03 15:04 张永清阅读(2076) 评论(0) 推荐(0)

2022年3月2日

Clickhouse 分布式表&本地表 &ClickHouse实现时序数据管理和挖掘

摘要：一、CK 分布式表和本地表 -> 关注清哥聊技术公众号，了解更多技术文章（1）CK是一个纯列式存储的数据库，一个列就是硬盘上的一个或多个文件（多个分区有多个文件），关于列式存储这里就不展开了，总之列存对于分析来讲好处更大，因为每个列单独存储，所以每一列数据可以压缩，不仅节省了硬盘，还可以降低磁盘I 阅读全文

posted @ 2022-03-02 11:22 张永清阅读(4019) 评论(0) 推荐(0)

2022年3月1日

软件性能测试分析与调优实践之路-Java应用程序的性能分析与调优-手稿节选

摘要： Java编程语言自从诞生起，就成为了一门非常流行的编程语言，覆盖了互联网、安卓应用、后端应用、大数据等很多技术领域，因此Java应用程序的性能分析和调优也是一门非常重要的课题。Java应用程序的性能直接关系到了很多大型电商网站的访问承载能力、大数据的数据处理量等，它的性能分析和调优往往还可以节省很多阅读全文

posted @ 2022-03-01 16:00 张永清阅读(1440) 评论(0) 推荐(0)

spark 下java list 或者scala list 转DataFrame or DataSet 总结

摘要：一、JAVA list 转 DataFrame or DataSet -> 关注清哥聊技术公众号，了解更多技术文章 case class CaseJava( var num: String, var id: String, var start_time: String, var istop_time 阅读全文

posted @ 2022-03-01 15:31 张永清阅读(2580) 评论(0) 推荐(0)

2021年12月3日

spark conf、config配置项总结

摘要： 1、structured-streaming的state 配置项总结 -> 关注清哥聊技术公众号，了解更多技术文章 Config Name Description Default Value spark.sql.streaming.stateStore.rocksdb.compactOnCommit 阅读全文

posted @ 2021-12-03 14:24 张永清阅读(3873) 评论(0) 推荐(0)

2021年11月22日

Spark-StructuredStreaming 下的checkpointLocation分析以及对接 Grafana 监控和提交Kafka Lag 监控

摘要：一、Spark-StructuredStreaming checkpointLocation 介绍 Structured Streaming 在 Spark 2.0 版本于 2016 年引入，是基于 Spark SQL 引擎构建的可扩展且容错的流处理引擎，对比传统的 Spark Streaming 阅读全文

posted @ 2021-11-22 14:33 张永清阅读(1300) 评论(0) 推荐(0)

2021年11月17日

java获取kafka consumer lag、endOffsets、beginningOffsets以及 KafkaConsumer总结

摘要：一、java获取kafka consumer lag、endOffsets、beginningOffsets -> 关注清哥聊技术公众号，了解更多技术文章 maven依赖： <dependency> <groupId>org.apache.kafka</groupId> <artifactId>ka 阅读全文

posted @ 2021-11-17 16:30 张永清阅读(2400) 评论(0) 推荐(0)

2021年11月6日

spark structured-streaming 最全的使用总结

摘要：一、spark structured-streaming 介绍 -> 关注清哥聊技术公众号，了解更多技术文章我们都知道spark streaming 在v2.4.5 之后就进入了维护阶段，不再有新的大版本出现，而且 spark streaming 一直是按照微批来处理streaming 数据的，阅读全文

posted @ 2021-11-06 15:45 张永清阅读(2769) 评论(0) 推荐(0)

spark读取和处理zip、gzip、excel、等各种文件最全的技巧总结

摘要：一、当后缀名为zip、gzip，spark可以自动处理和读取 -> 关注清哥聊技术公众号，了解更多技术文章 1、spark非常智能，如果一批压缩的zip和gzip文件，并且里面为一堆text文件时，可以用如下方式读取或者获取读取后的schema spark.read.text("xxxxxxxx/x 阅读全文

posted @ 2021-11-06 12:47 张永清阅读(5274) 评论(0) 推荐(0)

2021年8月30日

spark-sql 与hive 常用函数

摘要：窗口函数与分析函数 -> 关注清哥聊技术公众号，了解更多技术文章应用场景：（1）用于分区排序（2）动态Group By（3）Top N（4）累计计算（5）层次查询窗口函数FIRST_VALUE：取分组内排序后，截止到当前行，第一个值LAST_VALUE：取分组内排序后，截止到当前行，最后一个值L 阅读全文

posted @ 2021-08-30 11:07 张永清阅读(1678) 评论(0) 推荐(0)

2021年8月14日

flink clickhouse-jdbc和flink-connector 写入数据到clickhouse因为jar包冲突导致的60 seconds.Please check if the requested resources are available in the YARN cluster和Could not resolve ResourceManager address akka报错血案

摘要：一、问题现象，使用flink on yarn 模式，写入数据到clickhouse，但是在yarn 集群充足的情况下一直报：Deployment took more than 60 seconds. Please check if the requested resources are availa 阅读全文

posted @ 2021-08-14 13:22 张永清阅读(2925) 评论(0) 推荐(0)

2021年8月7日

clickhouse 安装启动报<Error> Application: DB::Exception: There is no profile 'default' in configuration file. 以及常见的错误的总结

摘要： 1、启动时报错<Error> Application: DB::Exception: There is no profile 'default' in configuration file. -> 关注清哥聊技术公众号，了解更多技术文章 2021.08.07 15:05:30.719723 [ 1 阅读全文

posted @ 2021-08-07 18:23 张永清阅读(5668) 评论(0) 推荐(0)

hbase报错ERROR: org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet 采坑记

摘要： 1、错误异常信息： -> 关注清哥聊技术公众号，了解更多技术文章 Exception in thread "main" java.lang.IllegalArgumentException: Failed to find metadata store by url: kylin_metadata@h 阅读全文

posted @ 2021-08-07 15:47 张永清阅读(2977) 评论(0) 推荐(0)

2021年6月17日

InfluxDB总结

摘要：一、简介 -> 关注清哥聊技术公众号，了解更多技术文章 InfluxDB（时序数据库）influxdb是一个开源分布式时序、时间和指标数据库，使用 Go 语言编写，无需外部依赖。其设计目标是实现分布式和水平伸缩扩展，是 InfluxData 的核心产品。常用的一种使用场景：监控数据统计，物联网传感器阅读全文

posted @ 2021-06-17 11:26 张永清阅读(3470) 评论(0) 推荐(0)

2021年6月11日

【转载】大数据OLAP系统--开源组件方案对比

摘要：开源大数据OLAP组件，可以分为MOLAP和ROLAP两类。ROLAP中又可细分为MPP数据库和SQL引擎两类。对于SQL引擎又可以再细分为基于MPP架构的SQL引擎和基于通用计算框架的SQL引擎： MOLAP一般对数据存储有优化，并且进行部分预计算，因此查询性能最高。但通常对查询灵活性有限制。 - 阅读全文

posted @ 2021-06-11 11:55 张永清阅读(1080) 评论(0) 推荐(0)

2021年5月18日

Spark任务性能调优总结

摘要：一、shuffle调优 -> 关注清哥聊技术公众号，了解更多技术文章大多数Spark作业的性能主要就是消耗在了shuffle环节，因为该环节包含了大量的磁盘IO、序列化、网络数据传输等操作。因此，如果要让作业的性能更上一层楼，就有必要对shuffle过程进行调优。但是也必须提醒大家的是，影响一个S 阅读全文

posted @ 2021-05-18 17:43 张永清阅读(441) 评论(0) 推荐(0)

2021年4月8日

谈谈在incubator-dolphinscheduler 中为啥不能及时看到python任务输出的print日志

摘要：一、incubator-dolphinscheduler 中如何获取shell类型的节点或者python类型的节点任务的日志 -> 关注清哥聊技术公众号，了解更多技术文章 1、在org.apache.dolphinscheduler.server.worker.task.AbstractComman 阅读全文

posted @ 2021-04-08 17:50 张永清阅读(1361) 评论(0) 推荐(0)

2021年3月15日

incubator-dolphinscheduler 如何在不写任何新代码的情况下，能快速接入到prometheus和grafana中进行监控

摘要：一、prometheus和grafana 简介 -> 关注清哥聊技术公众号，了解更多技术文章 Prometheus 是继 Kubernetes 之后的第二个 CNCF “毕业” 项目，其监控理念传承于由谷歌研发的一款内部监控软件，现主要开发语言为 go，代码目前已经托管在 github 中，遵从 a 阅读全文

posted @ 2021-03-15 18:01 张永清阅读(1280) 评论(0) 推荐(0)

2021年3月5日

【转载】Java并发之AQS详解

摘要：一、概述谈到并发，不得不谈ReentrantLock；而谈到ReentrantLock，不得不谈AbstractQueuedSynchronizer（AQS）！类如其名，抽象的队列式的同步器，AQS定义了一套多线程访问共享资源的同步器框架，许多同步类实现都依赖于它，如常用的ReentrantLo 阅读全文

posted @ 2021-03-05 16:53 张永清阅读(133) 评论(0) 推荐(0)

2021年2月20日

联童科技基于incubator-dolphinscheduler从0到1构建大数据调度平台之路

摘要：联童科技是一家智能化母婴童产业平台，从事母婴童行业以及互联网技术多年，拥有丰富的母婴门店运营和系统开发经验，在会员经营和商品经营方面，能够围绕会员需求，深入场景，更贴近合作伙伴和消费者，提供最优服务产品，公司致力于以技术来驱动母婴童产业的发展，公司也希望借助于大数据为客户提供更多智能数据分析和决策分阅读全文

posted @ 2021-02-20 11:16 张永清阅读(2200) 评论(2) 推荐(0)

2021年1月10日

软件性能测试分析与调优实践之路-Web中间件的性能分析与调优总结

摘要：本文主要阐述软件性能测试中的一些调优思想和技术，节选自作者新书《软件性能测试分析与调优实践之路》部分章节归纳。在国内互联网公司中，Web中间件用的最多的就是Apache和Nginx这两款了，包括很多大型电商网站淘宝、京东、苏宁易购等，都在使用Nginx或者Apache作为Web中间件。而且很多编程阅读全文

posted @ 2021-01-10 22:10 张永清阅读(2462) 评论(0) 推荐(0)

2020年12月17日

ClickHouse学习笔记--ClickHouse的整体特性

摘要：本文主要包含如下内容： ClickHouse适用场景 ClickHouse缺点 ClickHouse优点 ClickHouse表引擎-合并树 ClickHouse表引擎-合并树-稀疏索引 ClickHouse表引擎-内存引擎 ClickHouse表引擎-其他引擎 ClickHouse数据同步 Cli 阅读全文

posted @ 2020-12-17 14:10 张永清阅读(787) 评论(0) 推荐(0)

2020年9月13日

软件性能测试分析与调优实践之路-性能分析调优思想与调优技术总结

摘要：本文主要阐述软件性能测试中的一些调优思想和技术，节选自作者新书《软件性能测试分析与调优实践之路》部分章节归纳。一、性能分析与调优思想 -> 关注清哥聊技术公众号，了解更多技术文章 1、性能分析调优模型性能测试除了为获取性能指标外，更多是为了发现性能瓶颈和性能问题，然后对性能问题和瓶颈进行分析和阅读全文

posted @ 2020-09-13 11:41 张永清阅读(4518) 评论(0) 推荐(2)

2020年9月6日

Robot Framework自动化测试框架核心指南-如何做好自动化测试平台框架的设计

摘要：自动化测试如果需要能高效快速的支撑软件项目的测试，项目的快速迭代以及上线，除了以上我们介绍的需要许多的Lib来支持以及需要高效的去编写自动化测试案例外，还需要一个好的自动化测试框架平台来支撑我们的自动化测试案例的执行以及分析，自动化测试平台一般需要解决测试案例执行任务的创建，任务的管理，任务的调度，阅读全文

posted @ 2020-09-06 16:27 张永清阅读(1538) 评论(0) 推荐(1)

2020年7月16日

比较全的大数据技术组件整理以及相关理论论文整理

摘要：框架 Apache Hadoop：分布式处理架构，结合了 MapReduce(并行处理)、YARN(作业调度)和HDFS(分布式文件系统); Tigon：高吞吐量实时流处理框架。分布式编程 -> 关注清哥聊技术公众号，了解更多技术文章 AddThis Hydra ：最初在AddThis上开发的分布阅读全文

posted @ 2020-07-16 17:34 张永清阅读(2053) 评论(0) 推荐(0)

谈谈IT圈的门槛与学历的关系以及如何避免青春饭？

摘要：一、关于自己 -> 关注清哥聊技术公众号，了解更多技术文章我是一名80后的IT老兵，从今年出现疫情后，就感觉多少有些力不从心了，因为公司的业务做的不好，公司是做普惠金融的，疫情出现后，催收逾期就非常厉害，导致公司不敢大量放贷，从而就出现了公司收益减少。这时候公司内部很多人就慌了，因为担心公司会裁员阅读全文

posted @ 2020-07-16 11:12 张永清阅读(2080) 评论(0) 推荐(2)

2020年6月24日

架构设计思想-微服务架构设计模式

摘要：一、微服务架构设计中经常需要处理的问题罗列： -> 关注清哥聊技术公众号，了解更多技术文章 API Gateway 内部服务间互相调用服务发现服务容错、熔断、降级服务部署数据处理二、设计模式 1、微服务-聚合器设计模式：聚合器调用多个服务实现应用程序所需的功能。它可以是一个简单的 WEB 阅读全文

posted @ 2020-06-24 15:24 张永清阅读(2420) 评论(0) 推荐(0)

阿里巴巴开源canal 工具数据同步异常CanalParseException:parse row data failed，column size is not match for table......

摘要：一、异常现象截图 -> 关注清哥聊技术公众号，了解更多技术文章二、解决方式： 1、背景早期的canal版本(<=1.0.24)，在处理表结构的DDL变更时采用了一种简单的策略，在内存里维护了一个当前数据库内表结构的镜像(通过desc table获取)。这样的内存表结构镜像的维护存在问题，如果当阅读全文

posted @ 2020-06-24 14:26 张永清阅读(5931) 评论(0) 推荐(1)

2020年6月4日

大数据数据仓库架构设计基础概念和设计思想整理

摘要：一、ODS层 -> 关注清哥聊技术公众号，了解更多技术文章ODS 全称是 Operational Data Store，一般对应的是操作性数据存储，直接面向主题的，也叫数据运营层，通常是最接近数据源中数据的一层，数据源中的数据，经过抽取、洗净、传输，也就是通常说的 ETL 之后的数据存入本层。本层的阅读全文

posted @ 2020-06-04 13:02 张永清阅读(3499) 评论(0) 推荐(0)

比较全的常见的架构设计思想整理

摘要：一、MPP 架构 -> 关注清哥聊技术公众号，了解更多技术文章 1、MPP架构的基础概念 MPP (Massively Parallel Processing)，即大规模并行处理，在数据库非共享集群中，每个节点都有独立的磁盘存储系统和内存系统，业务数据根据数据库模型和应用特点划分到各个节点上，每台数阅读全文

posted @ 2020-06-04 12:42 张永清阅读(7710) 评论(0) 推荐(2)

2020年5月6日

windows下flume 采集如何支持TAILDIR和tail

摘要：一、问题：Windows 下 flume采集配置TAILDIR的时候，会报如下错误： -> 关注清哥聊技术公众号，了解更多技术文章 agent.sources.seqGenSrc.type = TAILDIR agent.sources.seqGenSrc.positionFile = .\\tai 阅读全文

posted @ 2020-05-06 15:52 张永清阅读(2334) 评论(0) 推荐(0)

2020年4月24日

curator-framework 使用采坑记之org.apache.zookeeper.ClientCnxn - Opening socket connection to server..........Will not attempt to authenticate using SASL (unknown error)报错解决

摘要：一、curator-framework 简介 -> 关注清哥聊技术公众号，了解更多技术文章 curator-framework 是对zookeeper做的分二次分布式封装处理，目前代码也是apache 开源社区维护，如下所示。 github地址：https://github.com/apache/c 阅读全文

posted @ 2020-04-24 16:28 张永清阅读(4692) 评论(0) 推荐(0)

人生是一个不断觉悟的过程

公告