当前位置: 首页 > 知识库问答 >
问题:

DataStage中变更捕获阶段和差异阶段之间的差异

蒋飞捷
2023-03-14

我正在尝试使用DataStage中的Change Capture和Difference阶段实现SCD Type1加载。这两项工作都工作得很好,没有任何错误,但我想知道这两个阶段之间的区别是什么,哪一个可以提供更好的性能

我已经尝试了几个测试用例来找到我发现的很少的差异

  • 在更改捕获阶段,我们需要具有相同列数的输入和具有相似数据类型的相同列名,但在差异阶段并非如此。

有人可以帮助我弄清楚这两个阶段之间的实际重要类比是什么。(欢迎任何相关的网页链接)

谢谢你。

共有2个答案

华星驰
2023-03-14

尝试缓慢变化的维度阶段。它为您做了更多的工作。

姜磊
2023-03-14

性能不是重点 - 它们应该是可比较的 - 更重要的是功能的角度来看。

>

  • DIFFERENCE 阶段仅在某些情况下返回“之前”列和之后的列(如果它们不是键或值列的一部分并且名称不同)

    变更捕获阶段返回“之后”列。BEfore列仅可用于删除

  •  类似资料:
    • 我们使用意图在两个活动之间切换,片段也是出于相同的目的。那么为什么我们不能总是使用意图而不是片段呢?

    • 本文向大家介绍成本差异和进度差异之间的差异,包括了成本差异和进度差异之间的差异的使用技巧和注意事项,需要的朋友参考一下 对于任何应用程序或专门用于任何项目,最关注的因素之一是在开发前和开发后阶段的预算管理和时间管理。因此,要评估任何项目的这两个主要因素,有很多方法,其中成本差异和进度差异是两个重要且主要的方法。 顾名思义,“成本差异”基于项目开发中花费的成本,而“进度差异”则基于相同开发中花费的时

    • 问题内容: 很快就有两个相等运算符:double equals( )和Triple equals( ),两者之间有什么区别? 问题答案: 简而言之: 操作员检查其实例值是否相等, 操作员检查引用是否指向同一实例, 长答案: 类是引用类型,可能有多个常量和变量在幕后引用类的同一单个实例。类引用保留在运行时堆栈(RTS)中,其实例保留在内存的堆区域中。当您控制平等时, 这意味着它们的实例是否彼此相等。

    • 本文向大家介绍C ++中两个给定时间段之间的差异,包括了C ++中两个给定时间段之间的差异的使用技巧和注意事项,需要的朋友参考一下 问题陈述 以字符串'HH:MM:SS'格式给出两个时间段。在这里,“ HH”代表小时,“ MM”代表分钟,“ SS”代表秒。找到这两个时间段之间相同字符串格式的差异。 示例 以下是C ++中的程序,用于查找所需的输出。 输出结果

    • 我编写了一个简单的脚本,它接受任意数量的参数来演示< code>$@和< code>$*之间的区别: 在我做的 CLI 上 这就是打印出来的 因为它们是相同的,这是否意味着等于?还是我遗漏了一点?

    • 我在ElasticSearch中有一个索引,其中包含日期类型的两个字段(metricsTime 但是,在导航到Kibana的Discover选项卡时,我得到了以下错误消息:class_cast_exception:无法对类型[org . joda . time . mutable datetime]和[org . joda . time . mutable datetime]应用[-]操作。这看起

    • 我来自Java背景,刚接触Scala。 我正在使用Scala和Spark。但是我不明白我在哪里使用和。 有人能告诉我在哪种情况下我需要使用这两个操作符吗?和之间有什么区别吗?

    • 我将数据存储到名为的数组列表中,然后使用以下函数显示每天的最高数量: 问题是当我使用<code>System.out时。println(“date”-”是sensor.map(sensor::getData)。get()) - 为什么会这样?如何在文本字段中打印整个列表。提前感谢您!