问答 查看内容
返回列表

创建数据库数据集的时候,数据库连接类型选直连还是抽取?

71 2
发表于 2024-9-3 11:09:16 | 查看全部 阅读模式
本帖最后由 观小策 于 2024-9-4 18:35 编辑

创建数据集的时候,需要确定数据库连接类型,我应该怎么选择?
截图202409031106046254.png




评论2

JeremyLv.1 发表于 2024-9-3 11:14:12 | 查看全部
很实用的案例
观小策楼主Lv.1 发表于 2024-9-4 18:35:38 | 查看全部
一、【直连】和【抽取(guan_index)】的区别:

(1)直连是直接查数据库,适合查询实时性较高的场景;guan_index即抽取, 是先把数据从数据库抽到BI平台上,再直接在BI上进行处理和计算,适合实时性要求不高的场景。

(2)直连的数据集的卡片写函数进行计算时使用【对应数据库】的语法,抽取数据集要用【spark语法】。
spark官方语法库:https://spark.apache.org/docs/latest/api/sql/index.html#date

(3)直连不能用ETL。


二、使用场景举例

1)需求场景1:无论何时,BI卡片都展示数据库里的实时数据

建议:做直连数据集,且无论直连数据集是否设置更新方式,都必须打开【支持实时卡片数据 】开关;

关于直连数据集缓存策略文档,可以看看这个文档
https://docs.guandata.com/?g=Doc ... =428134461289267200

2)需求场景2:同一天任何时间段查询&导出的需要结果一致

建议:做抽取数据集。

如果想做成直连数据集,也可以,就是数据库里的数据也是每天只更新1次。
否则一旦BI里的卡片卡片查询语句变了,从数据库拿到的结果可能会和之前查到的不一样,比如这种情况——卡片A和卡片B都用同一个直连数据集,卡片A是一个指标卡,卡片B是一个表格,他们的销售金额总计对不上


3)需求场景3:数据集的模型结构sql需要用全局参数做筛选条件

建议:只能做直连数据集。
因为在6.3版本之前,抽取数据集模型结构sql不支持用全局参数;6.3版本之后,抽取数据集的模型结构sql开始支持用全局参数,但是那个全局参数只在BI抽数的时候起作用,在卡片层面不起作用

回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信服务号
联系我们
电话:400-880-0750
邮箱:hello@guandata.com
Copyright © 2001-2024 观远社区 版权所有 All Rights Reserved. 浙 ICP 备15006424号-3
去回复 去发帖 返回顶部
快速回复 返回顶部 返回列表