问答 查看内容
返回列表

离线开发和etl的使用决策问题

86 1
发表于 5 天前 | 查看全部 阅读模式
数据接入场景:

1.读取ftp文件数据,每天增量更新前40天的数据
2.只用到读取数据中的几列

3.读到的这些数据,需要进一步做分组聚合、添加计算列的操作,再输出数据集。

问题
1.以上第3步是用ETL还是数开工作流实现比较好?
2.如果用数开工作流,是放在1个数据流还是2个数据流?

参考:
数开工作流:
广东赛壹便利店有限公司

ETL计算:
FR_imp_os_dailysales

评论1

观小瑜Lv.1 发表于 前天 13:37 | 查看全部
建议在一个数开的数据流完成

回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信服务号
联系我们
电话:400-880-0750
邮箱:hello@guandata.com
Copyright © 2001-2026 观远社区 版权所有 All Rights Reserved. 浙 ICP 备15006424号-3
去回复 去发帖 返回顶部
快速回复 返回顶部 返回列表