问答 查看内容
返回列表

数据集更新报错

101 1
发表于 2025-5-23 13:55:52 | 查看全部 阅读模式
数据集更新报错报错Direct buffer memory是什么原因呢

评论1

观小松楼主Lv.1 发表于 2025-5-23 14:11:05 | 查看全部
该报错通常是由于写入 Parquet 文件时发生Java 堆外内存溢出异常导致。具体原因及解决方案如下:
核心原因
数据集中存在数组类型字段,且大量字段值长度较大(通常为 JSON 格式存储),导致内存占用超出预期。
解决方案
字段预处理(推荐):
若确认字段值为 JSON 格式,可通过 get_json_object 函数 提前提取目标键值对,仅保留业务所需字段,避免抽取整个数组字段。

若还是未解决,可以联系相关技术支持排查处理~

回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信服务号
联系我们
电话:400-880-0750
邮箱:hello@guandata.com
Copyright © 2001-2025 观远社区 版权所有 All Rights Reserved. 浙 ICP 备15006424号-3
去回复 去发帖 返回顶部
快速回复 返回顶部 返回列表