问答 查看内容
返回列表

关于调度任务效率的问题

124 3
发表于 2025-12-29 10:00:49 | 查看全部 阅读模式
目前的整体运行效率很慢,但是服务器的负载占用很低,除了内存占用在80%,其他的都很低,cpu10%-20%
增加调度任务并行数之后,整体运行效率反而更慢了,本来一个任务五分钟,两个任务10分钟跑完,改成两个并行之后。跑完两个需要15分钟,请问这是什么原因

评论3

观小杰Lv.1 发表于 2025-12-29 18:10:10 | 查看全部
任务并发数和资源并非严格成正比,并行效率取决于 “集群总资源是否充足”“任务间资源竞争”“并行额外开销” 三个关键因素,只有在 “资源绝对充足、无竞争、无额外开销” 的理想场景下,并发数和资源利用率才接近正比。
假设集群总资源仅够支撑 1 个任务满负载运行(比如 CPU 4 核、内存 8G),两个任务并行时,每个任务只能分到 50% 的资源:
- 单任务原本 5 分钟,现在因资源不足,单任务耗时从 5→7.5 分钟以上;
- 叠加资源争抢(如磁盘 IO、网络带宽被占),最终两个并行任务总耗时拉到 15 分钟。
Guandata_19e761f8楼主Lv.1 发表于 2025-12-31 09:05:49 | 查看全部
观小杰 发表于 2025-12-29 18:10
任务并发数和资源并非严格成正比,并行效率取决于 “集群总资源是否充足”“任务间资源竞争”“并行额外开 ...

目前调度任务并行数设置为1,cpu占用在20-30,峰值极短时间内会到40%,并行数调整到2之后,占用还是这样,速度会变慢,是还有什么参数需要调整吗,能够跑满机器的性能
观小杰Lv.1 发表于 2025-12-31 13:49:31 | 查看全部
Guandata_19e761f8 发表于 2025-12-31 09:05
目前调度任务并行数设置为1,cpu占用在20-30,峰值极短时间内会到40%,并行数调整到2之后,占用还是这样 ...

首先需要确认环境中是否配置了双spark-Jobengine,其作用是将卡片和ETL、数据集更新任务的资源进行隔离,从而保证卡片的加载速度,在没有卡片任务运行的时候,这部分资源是不会被使用的。其次要看环境中的任务整体情况,是短小的密集型任务居多,还是大型任务多,结合具体情况可以适当调整资源分配。建议在售后服务群中联系我们的技术支持同事对环境做一次评估。

回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信服务号
联系我们
电话:400-880-0750
邮箱:hello@guandata.com
Copyright © 2001-2026 观远社区 版权所有 All Rights Reserved. 浙 ICP 备15006424号-3
去回复 去发帖 返回顶部
快速回复 返回顶部 返回列表