ETL中间结果缓存逻辑说明

文章 › 查看内容

ETL中间结果缓存逻辑说明

157 0 智能ETL 2026-4-27 18:58 发布者: 观小豪

ETL中间结果缓存，这个与ETL任务实际运行的关系，它的计算逻辑是什么，以及它的阈值调整可能会带来的影响...

一、ETL中间结果缓存作用

ETL 中间结果缓存是当 ETL 相对较复杂时（至少包含两个输出数据集且超过设置的复杂度阈值），通过启用该配置，系统会自动将中间运算结果进行缓存以加速整个 ETL 的运行效率。

二、ETL中间结果缓存阈值计算逻辑

如下图情况

1）第一列的input节点，因为它本身是没有计算逻辑的，所以input1和input2计算复杂度为1

2）第二列的Operator节点，因为它有了计算逻辑，但是因为前面的input节点没有，所以Operator1和Operator2计算复杂度只是在input的计算复杂度之上再加1，即为2

3）第三列的Operator节点，因为它本身有计算逻辑，所以复杂度为1，又因为前面有两个有计算逻辑的复杂度为2的节点，所以Operator3即是前面两个节点之和加上它本身的复杂度，即2+2+1=5

4）第四列的Operator节点，因为它本身有计算逻辑，所以复杂度为1，又因为前面有一个有计算逻辑的复杂度为5的节点，所以Operator4即是前面一个节点复杂度加上它本身的复杂度之和，即5+1=6

5）第五列的Operator节点，Operator5，Operator6，Operator7都是因为其本身有计算逻辑，所以复杂度为1，又因为前面有一个有计算逻辑的复杂度为6的节点，所以Operator5，Operator6，Operator7即是前面一个节点复杂度加上它本身的复杂度之和，即6+1=7；

Output2因为其后面没有计算节点了，因为它本身有计算逻辑，所以复杂度为1，又因为前面有一个有计算逻辑的复杂度为6的节点，所以Output2即是前面一个节点复杂度加上它本身的复杂度之和，即6+1=7，且终止在7

6）第六列的Operator节点，因为它本身有计算逻辑，所以复杂度为1，又因为前面有3个有计算逻辑的复杂度为7的节点，所以Operator8即是前面3个节点复杂度加上它本身的复杂度之和，即7+7+7+1=22

7）第七列的Output节点，因为它本身有计算逻辑，所以复杂度为1，又因为前面有一个有计算逻辑的复杂度为22的节点，所以Output1即是前面一个节点复杂度加上它本身的复杂度之和，即22+1=23

所以总复杂度，即Output1和Output2计算复杂度之和，即23+3=30