Arthas使用教程
简介

Arthas 是一款线上监控诊断产品,通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。
官网地址:https://arthas.aliyun.com/doc/
GitHub地址: https://github.com/alibaba/arthas
码云地址: http://arthas.gitee.io/
Arthas 是Alibaba开源的Java诊断工具,深受开发者喜爱。
当你遇到以下类似问题而束手无策时, Arthas 可以帮助你解决:
1.这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
2.我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
3.遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
4.线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
5.是否有一个全局视角来查看系统的运行状况?
6.有什么办法可以监控到JVM的实时运行状态?
7.怎么快速定位应用的热点,生成火焰图?
安装和启动Arthas
服务器上下载arthas-boot.jar
wget https://arthas.aliyun.com/arthas-boot.jar;
直接通过java -jar 启动arthas的jar包文件
java -jar arthas-boot.jar
选择应用 java 进程:nacos-server 进程是第 3个,则输入3,再输入回车/enter。Arthas 会 attach 到目标进程上,并输出日志:

核心监视功能
1: monitor监控方法的执行情况
监控指定类中方法的执行情况
用来监视一个时间段中指定方法的执行次数,成功次数,失败次数,耗时等这些信息
e:监控demo.MathGame类的primeFactors方法,并且每5S更新一次状态。

2: trace根据路径追踪查询消耗时间
对方法内部调用路径进行追踪,并输出方法路径上的每个节点上耗时。
简介:trace 命令能主动搜索 class-pattern/method-pattern 对应的方法调用路径,渲染和统计整个调用链路上的所有性能开销和追踪调用链路。
观察表达式的构成主要由ognl 表达式组成,所以你可以这样写"{params,returnObj}",只要是一个合法的 ognl 表达式,都能被正常支持。
很多时候我们只想看到某个方法的rt大于某个时间之后的trace结果,现在Arthas可以按照方法执行的耗时来进行过滤了,例如trace *StringUtils isBlank '#cost>100’表示当执行时间超过100ms的时候,才会输出trace的结果。
watch/stack/trace这个三个命令都支持#cost耗时条件过滤。

trace:查询UserController 中最耗时的方法
trace *.UserController *
然后trace函数指定类的指定方法
trace com.example.jvm.controller.UserController list

# 默认情况下,trace不会包含jdk里的函数调用,如果希望trace jdk里的函数。 # 需要显式设置--skipJDKMethod false。 trace --skipJDKMethod false demo.MathGame run

# 据调用耗时过滤,trace大于0.5ms的调用路径
trace demo.MathGame run '#cost > .5'

# 可以用正则表匹配路径上的多个类和函数,一定程度上达到多层trace的效果。 trace -E com.test.ClassA|org.test.ClassB method1|method2|method3
3: jad反编译耗时代码
jad --source-only *.UserController list
或者
jad com.example.jvm.controller.UserController list
4: watch检测函数返回值
方法执行数据观测,让你能方便的观察到指定方法的调用情况。
能观察到的范围为:返回值、抛出异常、入参,通过编写OGNL 表达式进行对应变量的查看。
参数说明:watch 的参数比较多,主要是因为它能在 4 个不同的场景观察对象

这里重点要说明的是观察表达式,观察表达式的构成主要由ognl 表达式组成,所以你可以这样写"{params,returnObj}",只要是一个合法的 ognl 表达式,都能被正常支持。
特别说明
watch 命令定义了4个观察事件点,即 -b 方法调用前,-e 方法异常后,-s 方法返回后,-f 方法结束后
4个观察事件点 -b、-e、-s 默认关闭,-f 默认打开,当指定观察点被打开后,在相应事件点会对观察表达式进行求值并输出
这里要注意方法入参和方法出参的区别,有可能在中间被修改导致前后不一致,除了 -b 事件点 params 代表方法入参外,其余事件都代表方法出参
当使用 -b 时,由于观察事件点是在方法调用前,此时返回值或异常均不存在
案例:


查看执行前参数
# -b 方法执行前的参数 watch demo.MathGame primeFactors "{params,returnObj}" -x 2 -b

# 查看方法中的属性
watch demo.MathGame primeFactors "{target}" -x 2 -b

查看某一属性的值
watch demo.MathGame primeFactors "{target.illegalArgumentCount}" -x 2 -b

检测方法在执行前-b、执行后-s的入参params、属性target和返回值returnObj
watch demo.MathGame primeFactors "{params,target,returnObj}" -x 2 -b -s -n 2

打印输入参数小于0的情况:
watch demo.MathGame primeFactors "{params[0],target}" "params[0]<0"

退出 arthas
如果只是退出当前的连接,可以用quit或者exit命令。Attach 到目标进程上的 arthas 还会继续运行,端口会保持开放,下次连接时可以直接连接上。
如果想完全退出 arthas,可以执行stop命令。

项目中使用


浙公网安备 33010602011771号