一.工具安装
1.源码下载:https://sourceforge.net/projects/gperftools.mirror/ (gperftools-2.7.tar.gz版本)
libunwind库源码:libunwind-1.3.1
2.库的安装:
1. tar zxvf google-perftools-2.7.tar.gz
2. cd google-perftools-2.7
3. ./configure --prefix=/usr --enable-frame-pointers (这个参数最好加上)
4. make
5. make install
同理, libunwind也是这么安装
二.工具的使用
1.使用时 需要 链接 tcmalloc (分析heap堆内存的情况), profiler(分析cpu的性能情况), unwind(依赖库) , 编译出的可执行 为 Test
2.执行时 三种情形 堆内存检查、堆内存分析、cpu分析
1 | gcc [...] -o myprogram -ltcmalloc |
1 | gcc [...] -o myprogram -ltcmalloc |
1 | gcc [...] -o myprogram -lprofiler |
3.注意事项: 执行时 如果报错 找不到 libunwind.so.8 和 libtcmalloc.so.4, 需要拷贝 系统库目录 /usr/lib64
生成的文件 可以用pprof命令 生成对应分析文件和格式
pprof的使用形式都是: pprof --option [ --focus=<regexp> ] [ --ignore=<regexp> ] [--line or addresses or functions] 可执行文件路径 对应的profile路径。方括号中的项目是可选项目。<regexp>表示正则表达式。
option可取的值有:text,gv,dot,ps,pdf,gif,list=<regexp>,disasm=<regexp>。表示不同的输出形式。其中list=<regexp>表示输出匹配正则表达式的函数的源代码,diasm=<regexp>表示输出匹配正则表达式的函数的反汇编代码。text是字符统计输出形式,其它的对应不同的图形文件格式。
例如:生成的记录文件 可以用 pprof 输出指定格式
pprof -- ./Test ./test.heap > testheap.pdf 生成的pdf统计图
这个命令 可能报错 sh: dot: command not found ---这里报错是因为--gv选项需要安装 graphviz 和 gv; 进行安装两者即可
三.原理分析
以上工具,主要涉及到两点, 内存分析 和 cpu分析
内存分析,主要是在程序中替代glibc的内存分配, 转而使用 google-perftool提供的tcmalloc:thread cache malloc,使用这个内存管理,一方面使用tcmalloc的内存分配;另一方面它具有内存统计功能
优点:个是内存allocate/deallocate的速度,通常情况下它的速度比glibc所提供的malloc要快;另一个方面是小内存(< =32K)的管理,它的小内存是在thread cache里面管理的,一方面减少了加锁的开销,另一方面用来表示小内存所用的额外的空间也比较小,比较节省空间。因此,对于多线程下,经常小内存的allocation/deallocation的程序(尤其多线程下使用STL比较多的程序),可以尝试使用一下tcmalloc
cpu分析, profiler是由google-perftool所提供的用来做cpu-profile的工具,大家对profile这个词已经不再陌生。Cpu-profile,它的主要功能就是通过采样的方式,给程序中cpu的使用情况进行“画像”,通过它所输出的结果,我们可以对程序中各个函数耗时情况一目了然。在对程序做性能优化的时候,这个是很重要的,先把最耗时的若干个操作优化好,程序的整体性能提升应该十分明显,这也是做性能优化的一个最为基本的原则—先优化最耗时的。