当前位置: 首页 > 文档资料 > FreeBSD 使用手册 >

第 26 章 DTrace

优质
小牛编辑
118浏览
2023-12-01
Written by Tom Rhodes.

26.1. 概述

DTrace,也称为动态跟踪,是由 Sun™开发的一个用来在生产和试验性生产系统上找出系统瓶颈的工具。在任何情况下它都不是一个调试工具,而是一个实时系统分析寻找出性能及其他问题的工具。

DTrace 是个特别好的分析工具,带有大量的帮助诊断系统问题的特性。还可以使用预先写好的脚本利用它的功能。用户也可以通过使用 DTrace D 语言创建他们自己定制的分析工具,以满足特定的需求。

在阅读了这一章节之后,你将了解:

  • DTrace 是什么,它提供了些哪些特性。

  • DTrace 在 Solaris™ 与 FreeBSD 上的实现的差别。

  • 如何在 FreeBSD 上开启和使用 DTrace。

在阅读这一章节之前,你应该了解:

  • 了解 UNIX® 和 FreeBSD 的基本知识(第 4 章 UNIX 基础)。

  • 熟悉基本的内核配置/编译(第 9 章 配置FreeBSD的内核).

  • 熟悉 FreeBSD 有关的安全知识 (第 15 章 安全)。

  • 了解如何获取和重新编译 FreeBSD 源代码(第 25 章 更新与升级 FreeBSD)。

警告:

这项特性目前仍被认为是试验性的。有些选项功能性缺失,另有一些可能还无法运行。最终,这个特性会适合用于生产,届时这篇文档也会做些适当的修改。

26.2. 实现上的差异

虽然 FreeBSD 上的 DTrace 与 Solaris™ 上的非常相似,在继续深入之前我们需要说明一下存在的差异。用户首先会注意到的便是 FreeBSD 上的 DTrace 需要明确地被启用。DTrace 相关的内核选项和模块必须开启后才能正常工作。稍后我们会作详细介绍。

有一个 DDB_CTF内核选项用来开启从内核与内核模块加载CTF 数据。CTF 是 Solaris™ Compact C Type Format封装了类似于 DWARF 和 venerable stabs简化的调试信息。CTF 数据是由ctfconvertctfmerge工具加入二进制文件的。ctfconvert工具分析由编译器生成的 DWARFELF 调试 section,ctfmerge 合并目标文件的CTF ELF section到可执行文件或共享库。更多关于在启用 FreeBSD内核上启用此项的详细内容即将完成。

比起 Solaris™, FreeBSD 有几个不同提供器。最值得注意的是 dtmalloc 提供器,可以让你根据类型追踪 FreeBSD 内核中的malloc()

只有 root 可以使用 FreeBSD 上的 DTrace。这是由系统安全上的差异造成的,Solaris™ 提供了一些 FreeBSD上还未实现的低层的安全检查。 同样,/dev/dtrace/dtrace 也被严格的限制为仅供root 用户访问。

最后,DTrace 为 Sun™ CDDL许可下发布的软件。随 FreeBSD 发行的Common Development and Distribution License可以在查阅/usr/src/cddl/contrib/opensolaris/OPENSOLARIS.LICENSE或者通过http://www.opensolaris.org/os/licensing查看在线版本。

这个许可表示带有 DTrace 选项的 FreeBSD 内核仍为BSD 许可; 然而, 以二进制发布模块,或者加载二进制模块则需遵守 CDDL

26.3. 启用 DTrace 支持

在内核配置文件中加入以下几行来开启对 DTrace 的支持:

options KDTRACE_HOOKSoptions DDB_CTF

注意:

使用 AMD64 架构的需要在内核配置文件中加入如下这行:

options KDTRACE_FRAME

此选项提供了对 FBT 特性的支持。DTrace 可以在没有此选项的情况下正常工作,但是函数边界跟踪便会有所限制。

所有的源代码都必须重新使用 CTF选项编译安装。重新编译 FreeBSD 源代码可以通过以下的命令完成:

# cd /usr/src# make WITH_CTF=1 kernel

系统需要重新启动。

在重新启动和新内核载入内存之后,需要添加 Korn shell的支持。因为 DTrace 工具包有一些工具是由 ksh写的。安装 shells/ksh93。同样也可以通过 shells/pdksh或者 shells/mksh使用这些工具。

最后是获得最新的 DTrace 工具包。当前版本可以通过下面的链接找到http://www.opensolaris.org/os/community/dtrace/dtracetoolkit/。这个工具包含有一个安装机制,尽管如此,并不需要安装便可使用它们。

26.4. 使用 DTrace

在使用 DTrace 的功能之前,DTrace 设备必须存在。使用如下的命令装载此设备:

# kldload dtraceall

DTrace 支持现在应该可以使用了。管理员现在可以使用如下的命令查看所有的探测器:

# dtrace -l | more

所有的输出都传递给 more 工具,因为它们会很快超出屏幕的显示区域。此时,DTrace应该被认为是能够正常工作的了。现在是该考察工具包的时候了。

工具包是实现写好的一堆脚本,与 DTrace 一起运行来收集系统信息。有脚本用来检查已打开的文件,内存,CPU使用率和许多东西。使用如下的命令解开脚本:

# gunzip -c DTraceToolkit* | tar xvf -

使用 cd 命令切换到那个目录,并修改所有文件的可执行权限,把那些名字小写的文件权限改为755

所有这些脚本都需要修改它们的内容。那些指向/usr/bin/ksh 需要修改成/usr/local/bin/ksh,另外使用/usr/bin/sh 需要变更为/bin/sh,最后还有使用/usr/bin/perl 的需要变更为/usr/local/bin/perl

重要:

此刻还需谨慎提醒一下读者 FreeBSD 的 DTrace 支持仍是不完整的试验性 的。这些脚本中的大多数都无法运行,因为它们过于针对 Solaris™或者使用了目前还不支持的探测器。

在撰写这篇文章的时候,DTrace 工具包中只有两个脚本在FreeBSD 上是完全支持的:hotkernelprocsystime脚本。这两个脚本便是我们下一部分将要探讨的:

hotkernel被设计成验明哪个函数占用了内核时间。正常运行的话,它将生成类似以下的输出:

# ./hotkernelSampling... Hit Ctrl-C to end.

系统管理员必须使用Ctrl+C 组合键停止这个进程。紧接着中止之后,脚本便会一张内核函数与测定时间的列表,使用增量排序输出:

kernel`_thread_lock_flags   2   0.0%0xc1097063  2   0.0%kernel`sched_userret2   0.0%kernel`kern_select  2   0.0%kernel`generic_copyin 3   0.0%kernel`_mtx_assert  3   0.0%kernel`vm_fault 3   0.0%kernel`sopoll_generic 3   0.0%kernel`fixup_filename 4   0.0%kernel`_isitmyx 4   0.0%kernel`find_instance4   0.0%kernel`_mtx_unlock_flags5   0.0%kernel`syscall5   0.0%kernel`DELAY5   0.0%0xc108a253  6   0.0%kernel`witness_lock 7   0.0%kernel`read_aux_data_no_wait7   0.0%kernel`Xint0x80_syscall 7   0.0%kernel`witness_checkorder   7   0.0%kernel`sse2_pagezero8   0.0%kernel`strncmp9   0.0%kernel`spinlock_exit 10   0.0%kernel`_mtx_lock_flags 11   0.0%kernel`witness_unlock15   0.0%kernel`sched_idletd 137   0.3%0xc10981a542139  99.3%

这个脚本也能与内核模块一起工作。要使用此特性,用 -m 标志运行脚本:

# ./hotkernel -mSampling... Hit Ctrl-C to end.^CMODULE  COUNT   PCNT0xc107882e  1   0.0%0xc10e6aa4  1   0.0%0xc1076983  1   0.0%0xc109708a  1   0.0%0xc1075a5d  1   0.0%0xc1077325  1   0.0%0xc108a245  1   0.0%0xc107730d  1   0.0%0xc1097063  2   0.0%0xc108a253 73   0.0%kernel874   0.4%0xc10981a5 213781  99.6%

procsystime脚本捕捉并打印给定 PID 的系统调用时间。在下面的例子中,新生成了一个 /bin/csh实例。procsystime 执行后则等待在新运行的csh 上键入一些命令。 这是测试的结果:

# ./procsystime -n cshTracing... Hit Ctrl-C to end...^CElapsed Times for processes csh, SYSCALL  TIME (ns)  getpid 6131 sigreturn 8121   close19127   fcntl19959 dup26955 setpgid28070stat31899 setitimer40938   wait462717 sigaction67372 sigprocmask 119091gettimeofday 183710   write 263242  execve 492547   ioctl 770073   vfork3258923sigsuspend6985124read 3988049784

正如显示的那样,read系统调用似乎使用了最多的纳秒单位时间,getpid() 系统调用使用了最少的时间。

26.5. D 语言

DTrace 工具包包括了很多由 DTrace 特殊语言写成的脚本。在 Sun™ 的文档中称这类语言为 “D 语言”,它与 C++ 非常类似。对此语言更深入的讨论则超出了这篇文章的范围。更多相关的讨论可以在http://wikis.sun.com/display/DTrace/Documentation找到。