当前位置：首页 > 软件库 > 服务器软件 > 分布式应用/网格 >

Uber JVM Profiler

分布式追踪工具

授权协议 Apache 2.0

开发语言 Java

所属分类服务器软件、分布式应用/网格

软件类型开源软件

地区不详

投递者楚良平

操作系统跨平台

开源组织 Uber

适用人群未知

软件概览

JVM Profiler 是 Uber Engineering 团队开源的一个分布式探查器，用于收集性能和资源使用率指标为进一步分析提供服务。尽管它是为 Spark 应用而构建的, 但它的通用实现使其适用于任何基于 JVM 的服务或应用。

JVM Profiler 由三项主要功能组成, 它使收集性能和资源使用率指标变得更容易, 然后可以将这些指标 (如 Apache Kafka) 提供给其他系统进行进一步分析:

代理功能 ( java agent ) : 支持用户以分布式的方式收集各种指标 (例如如 CPU/内存利用率) ，用于 JVM 进程的堆栈跟踪。
高级分析功能（Advanced profiling capabilities）: 支持跟踪任意 Java 方法和用户代码中的参数, 而不进行任何实际的代码更改。此功能可用于跟踪 Spark 应用的 HDFS NameNode RPC 调用延迟, 并标识慢速方法调用。它还可以跟踪每个 Spark 应用读取或写入的 HDFS 文件路径, 用以识别热文件后进一步优化。
数据分析报告( Data analytics reporting ): 使用 JVM Profile 可以将指标数据推送给 Kafka topics 和 Apache Hive tables , 提高数据分析的速度和灵活性。

典型用例

JVM Profiler 支持各种用例, 最典型的是能够检测任意 Java 代码。基于简单的配置, JVM Profiler 就可以附加到 Spark 应用中的每个执行者（executor）收集 Java 方法运行时度量。下面, 我们对其中的一些用例进行讨论:

Right-size executor : JVM Profiler 中的内存度量支持跟踪每个执行者的实际内存使用情况。借此可以在 Spark 应用中 ”executor-memory” 设置最优参数。
监视 HDFS NameNode RPC 延迟: 例如在 Spark 应用中对类 org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolTranslatorPB 的方法进行了分析并确定 NameNode 调用的延迟。Uber 每天都要监控5万多个 Spark 应用, 其中有数以亿计的这种 RPC 调用。
监视驱动程序丢弃的事件: 例如监视 org.apache.spark.scheduler.LiveListenerBus.onDropEvent, 跟踪 Spark 驱动程序事件队列太长、队列删除事件。
跟踪数据沿袭: 例如分析 Java 方法上的文件路径参数 ( org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolTranslatorPB.getBlockLocations , org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolTranslatorPB.addBlock ) , 可以跟踪哪些文件是由 Spark 应用读取和写入的。

介绍来源：RiboseYim

使用案例

Uber jvm profiler 使用

背景 uber jvm profiler是用于在分布式监控收集jvm 相关指标，如:cpu/memory/io/gc信息等安装确保安装了maven和JDK>=8前提下，直接mvn clean package java application 说明直接以java agent的部署就可以使用使用 java -javaagent:jvm-profiler-1.0.0.jar=reporter=c
Yarn的JVM重用功能——uber

在文章开头，我想先做几点说明： 1、本文的内容来自我对Yarn的相应功能的理解和实践。而我对该部分功能的理解主要来自对Hadoop的开发者之前相应言论的分析，并且我也将我的分析发给了Hadoop community，并得到了Yarn的创始人兼架构师Arun Murthy的肯定回复。 2、本文中uber的配置部分，主要参考之前Hadoop开发者的言论。但是我当初看该言论的时候对一些细节有所疑惑，因
MapReduce running in uber mode （jvm重用）

原文 http://blog.csdn.net/samhacker/article/details/15692003 yarn-site.xml 主要是这几个参数 - mapreduce.job.ubertask.enable | (false) | 是否启用user功能。如果启用了该功能，则会将一个“小的application”的所有子task在同一个JVM里面执行，达到JVM重用的目的。这个
IDEA修改JVM内存配置

修改IDEA的NVM内存配置中的内存大小及垃圾回收算法配置文件位置为idea安装目录下的bin文件夹中的…vmoptions文件，64位系统用的是文件名包含64的。原配置如下： -Xms128m -Xmx750m -XX:ReservedCodeCacheSize=240m -XX:+UseConcMarkSweepGC -XX:SoftRefLRUPolicyMSPerMB=50 -ea -
YARN JVM重用功能——uber

Hadoop 1.x中的JVM重用功能简单回顾一下Hadoop 1.x中的JVM重用功能用户可以通过更改配置，来指定TaskTracker在同一个JVM里面最多可以累积执行的Task的数量（默认是1）。这样的好处是减少JVM启动、退出的次数，从而达到提高任务执行效率的目的。配置的方法通过设置mapred-site.xml里面参数mapred.job.reuse.jvm.num.tasks的
【JVM调优】

JVM调优情况十分复杂，各种情况都可能导致垃圾回收不能够达到预想的效果。对于场景问题，可以从如下几个大方向进行设计：大访问压力下，MGC 频繁一些是正常的，只要MGC 延迟不导致停顿时间过长或者引发FGC ，那可以适当的增大Eden 空间大小，降低频繁程度，同时要保证，空间增大对垃圾回收产生的停顿时间增长是可以接受的。如果MinorGC 频繁，且容易引发 Full GC。需要从如下几个角度进行
JVM参数 Options

我们根据JVM参数以-X开头或-XX开头将JVM参数分成三个部分： 1、以-开头的是标准VM选项，VM规范的选项； 2、以-X开头的都是非标准的（这些参数并不能保证在所有的JVM上都被实现），而且如果在新版本有什么改动也不会发布通知。 3、以-XX开头的都是不稳定的并且不推荐在生产环境中使用。这些参数的改动也不会发布通知。 Bool型参数选项：-XX:+ 打开， -XX:- 关闭。（比如-XX:+
几个常用的profiler工具对比jprofiler、vituralVM、yourkit、JVM profler

virtualVM是我几年前用过的jdk自带的监控工具，能监控内存，堆栈，线程等粗略的统计信息； JProfiler是最近用的，比virtualVM要更详细，更专业，基本上覆盖了virtualVM的功能点，还有一些更细致的功能，精确到代码某一行，是个单进程java分析利器。 yourkit没有用过，大体功能和JProflier类似 JVM profiler是个好东西，可以分析spark
什么是uber-jar

在maven的一些文档中我们会发现 "uber-jar"这个术语，许多人看到后感到困惑。其实在很多编程语言中会把super叫做uber （因为suber可能是关键字），这是上世纪80年代开始流行的，比如管superman叫uberman。所以uber-jar从字面上理解就是super-jar，这样的jar不但包含自己代码中的class ，也会包含一些第三方依赖的jar，也就是把自身的代码和其依赖

Uber JVM Profiler

典型用例

同类工具

相关阅读

相关文章

相关问答

相关文档