前提:数据集每更新一次就会生成一个历史数据文件,这个文件存放在数据集文件夹下,因此这个数据集文件夹的大小,包含了“数据量的大小+每次更新产生的这个历史数据文件大小”
1)如果bi版本在6.3版本以前(不包含6.3),前台bi数据集上显示的这个“数据集大小”,代表的是存储在数据库里面的“数据集文件”的整个大小,也就是包含了“数据量的大小+每次更新产生的这个历史数据文件大小”。
1.1)这个历史数据文件的清理逻辑:是在数据集最近的一次更新的两小时后,以下图这个举例,最近一次更新时间是2025-11-13 06:00:25,那么“两小时”后触发自动清理,也就是2025-2025-11-13 08:00:25开始自动清理历史数据文件,最后会保留最近的两个历史数据文件,以前的都会被清理掉。
1.2)注意:
也就可能越到数据集数据量没有变化的情况下,每次更新后“数据集大小”变大的情况,实际上是因为更新后会有一个历史数据文件产生,因此统计的数据集大小累加了这个文件的大小;
且在自动清理历史数据文件后,这个数据集大小不会再减小,它已经固定住了就是展示每次更新后的大小。
2)如果bi版本在6.3版本以后(含6.3版本),前台bi数据集上显示的这个“数据集大小”,代表的就是实际“数据量的大小”,不会统计历史数据文件大小。
2.1)这个历史数据文件的清理逻辑同上,也是在数据集最近的一次更新的两小时后触发自动清理
2.2)注意:
也就可能越到配置的数据集阈值明明大于数据集的数据集大小,但是也触发了数据集告警的情况,实际上是因为数据集阈值这边判断的是数据集文件的大小,而数据集文件大小包含了数据量的大小和历史数据文件的大小,所以可能出现这个情况,详见https://community.guandata.com/f ... thread&tid=1929
|