"); //-->
本文分享自天翼云开发者社区《flinkcdc中checkpoint不成功问题排查》,作者:徐****东
使用flink-1.16和flinkcdc-3.0进行数据接入,采用standalone模式。运行一段时间后checkpoint开始失败,但日志中没有报错信息。

因savepoint和checkpoint机制一致,使用手动打savepoint断点的方式,尝试查明失败原因。执行指令:
/usr/local/flink/bin/flink savepoint ${job_id} /usr/local/flink-cdc/savepoint/
执行后报错,发现如下报错信息。
[1]:Caused by: org.apache.flink.util.SerializedThrowable: java.util.concurrent.ExecutionException: java.io.IOException: Size of the state is larger than the maximum permitted memory-backed state. Size=5325329, maxSize=5242880. Consider using a different checkpoint storage, like the FileSystemCheckpointStorage.
经分析,是作业的state,默认使用内存存储。随着作业的运行,state超出允许的最大内存,所以无法存储,导致checkpoint被cancel进而失败。
直接原因是作业的state,默认使用内存存储。随着作业的运行,state超出允许的最大内存,所以无法存储,导致checkpoint被cancel进而失败。
尝试在flink-conf.yaml中添加如下参数,加大内存限制。发现checkpoint仍会超出内存限制失败。排查源码发现,flink在1.16已去掉该参数。官方建议standalone模式仅作为测试,因此不提供加大内存限制的方式。
state.backend.memory.max-state-size: 10000000
正确解决办法为,使用hdfs存储checkpoint。
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。 联系我们
相关推荐
通讯协议对智能家居的影响究竟有多大?
基于大数据与深度学习的穿戴式运动心率算法
数据中心的核心:飞思卡尔通信处理技术,助用户“一马当先”
2024年政府工作十大任务发布,大数据、人工智能是重点
丰田将与腾讯在电动汽车人工智能、云计算和大数据方面展开合作
大数据数据场景下的网络精准规划与优化
物联网开发者大会清华张林演讲
大数据对网络技术和产业的挑战
关于大数据的基本资料
如何快速搭建Hadoop运行环境
用大数据方法协助研发下一代电池电解液
大数据与可穿戴设备将改变生活
大数据时代
IDC预计,2029年中国大数据总体市场规模将超730亿美元
大数据:高端安全检测的必由之路
晶圆代工厂商牵手RISC-V企业,瞄准低功耗AI芯片
GMIF2024聚焦产业创新之道 共谋存储生态繁荣发展
车载模块原理分析与电路设计详解
工信部:我国新能源汽车发展正带动产业生态全面重塑
上海:加快智算芯片国产化部署
IDC预计,2028年中国大数据总体市场规模将超621亿美元
大数据时代到来,我们电子工程师如何应对?
大数据产业链构成分析
大数据在物流行业的应用
昆山的朋友,你知道物联网行业的这个消息吗?