性能分析方法总结之pprof
1、代码实例
以下例子除了特别说明,都以这段代码为实例。
package main
import (
"log"
"time"
"net/http"
_ "net/http/pprof"
)
var datas []string
func main() {
go func() {
for {
log.Printf("len: %d", Add("go-programming-tour-book"))
time.Sleep(time.Millisecond * 10)
}
}()
_ = http.ListenAndServe("0.0.0.0:6060", nil)
}
func Add(str string) int {
data := []byte(str)
datas = append(datas, string(data))
return len(datas)
}
2、性能分析方法
2.1通过浏览器分析
运行程序后,在浏览器访问http://127.0.0.1:6060/debug/pprof/
2.2通过交互式终端分析
1)分析CPU资源占用情况
运行命令go tool pprof http://localhost:6060/debug/pprof/profile\?seconds\=60
执行该命令后,需等待 60 秒(可调整 seconds 的值),pprof 会进行 CPU Profiling,结束后将默认进入 pprof 的命令行交互式模式,可以对分析的结果进行查看或导出。另外如果你所启动的 HTTP Server 是 TLS 的方式,那么在调用 go tool pprof 时,需要将调用路径改为:go tool pprof https+insecure://localhost:6060/debug/pprof/profile\?seconds\=60。可以通过top 10命令查看资源占用前10的函数。
相关参数说明:
-
- flat:函数自身的运行耗时。
- flat%:函数自身在 CPU 运行耗时总比例。
- sum%:函数自身累积使用 CPU 总比例。
- cum:函数自身及其调用函数的运行总耗时。
- cum%:函数自身及其调用函数的运行耗时总比例。
- Name:函数名。
2)分析内存占用情况
执行命令go tool pprof http://localhost:6060/debug/pprof/heap
命令执行完毕显示内容如下图:

执行该命令后,能够很快的拉取到其结果,因为它不需要像 CPU Profiling 做采样等待,这里需要注意的一点是 Type 这一个选项,你可以看到它默认显示的是 inuse_space,实际上可以针对多种内存概况进行分析,常用的类别如下:
-
- inuse_space:分析应用程序的常驻内存占用情况。
- alloc_objects:分析应用程序的内存临时分配情况。
- inuse_objects:查看每个函数所分别的对象数量
- alloc_space:查看分配的内存空间大小
3)分析协程情况
执行命令go tool pprof http://localhost:6060/debug/pprof/goroutine
在查看 goroutine 时,我们可以使用 traces 命令,这个命令会打印出对应的所有调用栈。
4)分析mutex情况
执行命令go tool pprof http://localhost:6061/debug/pprof/mutex
可以调用 top 命令,查看互斥量的排名,也可以调用 list 命令,看到指定函数的代码情况(包含特定的指标信息,例如:耗时)。
注意:需要特别注意的是 runtime.SetMutexProfileFraction 语句,如果未来希望进行互斥锁的采集,那么需要通过调用该方法来设置采集频率,若不设置或没有设置大于 0 的数值,默认是不进行采集的。例如如下代码:
func init() {
runtime.SetMutexProfileFraction(1)
}
func main() {
var m sync.Mutex
var datas = make(map[int]struct{})
for i := 0; i < 999; i++ {
go func(i int) {
m.Lock()
defer m.Unlock()
datas[i] = struct{}{}
}(i)
}
_ = http.ListenAndServe(":6061", nil)
}
5)分析block情况
执行命令go tool pprof http://localhost:6061/debug/pprof/block
可以调用 top 命令,查看阻塞的排名,也可以调用 list 命令,查看阻塞的具体情况。
注意:与 Mutex 的 runtime.SetMutexProfileFraction 相似,Block 也需要调用 runtime.SetBlockProfileRate() 进行采集量的设置,否则默认关闭,若设置的值小于等于 0 也会认为是关闭。
2.3查看可视化界面
首先,运行程序,然后从路由http://127.0.0.1:6060/debug/pprof/profile获取profile文件。
然后,执行go tool pprof -http=:6001 profile命令,如果出现错误提示 Could not execute dot; may need to install graphviz.,那么意味着你需要安装 graphviz 组件。
3、通过测试用例做分析
3.1代码
add.go
package main
func Add(str string) int {
data := []byte(str)
datas = append(datas, string(data))
return len(datas)
}
add_test.go
package main
import (
"testing"
)
func TestAdd(t *testing.T) {
_ = Add("go-programming-tour-book")
}
func BenchmarkAdd(b *testing.B) {
for i := 0; i < b.N; i++ {
Add("go-programming-tour-book")
}
}
3.2对CPU进行分析
首先,执行命令go test -bench=. -cpuprofile=cpu.profile,执行完毕后会在当前命令生成 cpu.profile 文件。
然后,执行命令go tool pprof -http=:6001 cpu.profile,即可在浏览器查看CPU情况。
3.3对内存进行分析
首先,执行命令go test -bench=. -memprofile=mem.profile,执行完毕后会在当前命令生成mem.profile 文件。
然后,执行命令go tool pprof -http=:6001 mem.profile,即可在浏览器查看内存使用情况。
4、通过lookup写入文件做分析
4.1代码
package main
import (
"io"
"net/http"
"runtime"
"os"
"runtime/pprof"
)
type LookupType int8
const (
LookupGoroutine LookupType = iota
LookupThreadcreate
LookupHeap
LookupAllocs
LookupBlock
LookupMutex
)
func pprofLookup(lookupType LookupType, w io.Writer) error {
var err error
switch lookupType {
case LookupGoroutine:
p := pprof.Lookup("goroutine")
err = p.WriteTo(w, 2)
case LookupThreadcreate:
p := pprof.Lookup("threadcreate")
err = p.WriteTo(w, 2)
case LookupHeap:
p := pprof.Lookup("heap")
err = p.WriteTo(w, 2)
case LookupAllocs:
p := pprof.Lookup("allocs")
err = p.WriteTo(w, 2)
case LookupBlock:
p := pprof.Lookup("block")
err = p.WriteTo(w, 2)
case LookupMutex:
p := pprof.Lookup("mutex")
err = p.WriteTo(w, 2)
}
return err
}
func init() {
runtime.SetMutexProfileFraction(1)
runtime.SetBlockProfileRate(1)
}
func main() {
http.HandleFunc("/lookup/heap", func(w http.ResponseWriter, r *http.Request) {
_ = pprofLookup(LookupHeap, os.Stdout)
})
http.HandleFunc("/lookup/threadcreate", func(w http.ResponseWriter, r *http.Request) {
_ = pprofLookup(LookupThreadcreate, os.Stdout)
})
http.HandleFunc("/lookup/block", func(w http.ResponseWriter, r *http.Request) {
_ = pprofLookup(LookupBlock, os.Stdout)
})
http.HandleFunc("/lookup/goroutine", func(w http.ResponseWriter, r *http.Request) {
_ = pprofLookup(LookupGoroutine, os.Stdout)
})
_ = http.ListenAndServe("0.0.0.0:6060", nil)
}
通过 runtime/pprof 所提供的 Lookup 方法来进行相关内容的采集和调用,其一共支持六种类型,分别是:goroutine、threadcreate、heap、block、mutex,其提供了 io.Writer 接口,也就是只要实现了对应的 Write 方法,我们可以将其写到任何支持地方去。
参考:Go 大杀器之性能剖析 PProf(上) | Go 语言编程之旅 (eddycjy.com)

浙公网安备 33010602011771号