如何用JVM诊断神器Arthas进行实战分析?

摘要:什么是Arthas(阿尔萨斯) 阿里开源的Java诊断工具,它可以在运行时对Java应用程序进行动态诊断和调试 当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Excep
什么是Arthas(阿尔萨斯) 阿里开源的Java诊断工具,它可以在运行时对Java应用程序进行动态诊断和调试 当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception? 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了? 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗? 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现! 是否有一个全局视角来查看系统的运行状况? 有什么办法可以监控到 JVM 的实时运行状态? 怎么快速定位应用的热点,生成火焰图? 怎样直接从 JVM 内查找某个类的实例? 地址 github:https://github.com/alibaba/arthas 官网:https://arthas.aliyun.com/ 版本:Arthas-3.6.9 环境说明   Arthas支持 JDK 6+,支持 Linux/Mac/Windows,采用命令行交互模式,同时提供丰富的Tab自动补全功能,进一步方便进行问题的定位和诊断。 安装&下载 方式一 curl -O https://arthas.aliyun.com/math-game.jar java -jar math-game.jar 方式二 官网地址:https://arthas.aliyun.com/   注:启动Arthas时监听本机是否启动java进程;由于本地没有启动java进程,所以启动Arthas失败,下面提示信息也说的很清楚了~ 本地测试Arthas源码包:https://cyb-data-backup.oss-cn-guangzhou.aliyuncs.com/java/Arthas/arthas-packaging-3.6.9-bin.zip 使用 运行日志路径 ~/logs/arthas/arthas.log 退出 arthas 如果只是退出当前的连接,其他客户端不受影响,可以用 quit或者exit命令 目标进程上的 arthas 还会继续运行,端口保持开放,下次连接时执行java -jar arthas-boot.jar可以直接连接上 如果想完全退出 arthas,可以执行stop命令 生产环境中,推荐使用:stop 常用基础命令实战 base64- base64 编码转换,和 linux 里的 base64 命令类似 cat- 打印文件内容,和 linux 里的 cat 命令类似 cls- 清空当前屏幕区域 echo- 打印参数,和 linux 里的 echo 命令类似 grep- 匹配查找,和 linux 里的 grep 命令类似 help- 查看命令帮助信息 history- 打印命令历史 keymap- Arthas 快捷键列表及自定义快捷键 pwd- 返回当前的工作目录,和 linux 命令类似 quit- 退出当前 Arthas 客户端,其他 Arthas 客户端不受影响 reset- 重置增强类,将被 Arthas 增强过的类全部还原,Arthas 服务端关闭时会重置所有增强过的类 session- 查看当前会话的信息 stop- 关闭 Arthas 服务端,所有 Arthas 客户端全部退出 tee- 复制标准输入到标准输出和指定的文件,和 linux 里的 tee 命令类似 version- 输出当前目标 Java 进程所加载的 Arthas 版本号 其他命令:https://arthas.aliyun.com/doc/commands.html   注:每个命令如何使用,直接点进去查看示例教程即可~ JVM命令实战 dashboard- 当前系统的实时数据面板 getstatic- 查看类的静态属性   heapdump- dump java heap, 类似 jmap 命令的 heap dump 功能 jvm- 查看当前 JVM 的信息 logger- 查看和修改 logger mbean- 查看 Mbean 的信息 memory- 查看 JVM 的内存信息 ognl- 执行 ognl 表达式 perfcounter- 查看当前 JVM 的 Perf Counter 信息 sysenv- 查看 JVM 的环境变量 sysprop- 查看和修改 JVM 的系统属性 thread- 查看当前 JVM 的线程堆栈信息 vmoption- 查看和修改 JVM 里诊断相关的 option vmtool- 从 jvm 里查询对象,执行 forceGc dashboard 字段说明 id Java 级别的线程 ID name 线程名称 group 线程组名称 proirity 线程优先级,1 ~ 10 之间的数字,越大优先级越高 state 线程的状态 cpu 线程的 cpu 使用率 delta_time 上次采样之后线程运行增量 CPU 时间,数据格式为秒 time 线程运行总 CPU 时间,数据格式为 分:秒 interupted 当前线程是否中断 daemon 是否是 daemon 守护线程 字段说明 used 当前使用了多少内存 total 总共分配了多少内存 max 最大使用了多少 usage 使用比例 gc 垃圾回收器 thread 参数说明 参数名称参数说明 id 线程 id [n:] 指定最忙的前 N 个线程并打印堆栈 [b] 找出当前阻塞其他线程的线程 [i<value>] 指定 cpu 使用率统计的采样间隔,单位为毫秒,默认值为 200 [--all] 显示所有匹配的线程 heapdump 生成堆栈快照 heapdump/Users/chenyanbin/Desktop/1.hprof class/classloader 相关 classloader- 查看 classloader 的继承树,urls,类加载信息,使用 classloader 去 getResource dump- dump 已加载类的 byte code 到特定目录 jad- 反编译指定已加载类的源码 mc- 内存编译器,内存编译.java文件为.class文件 redefine- 加载外部的.class文件,redefine 到 JVM 里 retransform- 加载外部的.class文件,retransform 到 JVM 里 sc- 查看 JVM 已加载的类信息 sm- 查看已加载类的方法信息 monitor/watch/trace 相关 monitor- 方法执行监控 stack- 输出当前方法被调用的调用路径 trace- 方法内部调用路径,并输出方法路径上的每个节点上耗时 tt- 方法执行数据的时空隧道,记录下指定方法每次调用的入参和返回信息,并能对这些不同的时间下调用进行观测 watch- 方法执行数据观测