袋鼠云云原生一站式数据中台PaaS——数栈,覆盖了建设数据中心过程中所需要的各种工具(包括数据开发平台、数据资产平台、数据科学平台、数据服务引擎等),完整覆盖离线计算、实时计算应用,帮助企业极大地缩短数据价值的萃取过程,提高提炼数据价值的能力。

数栈架构图
目前,数栈-离线开发平台(BatchWorks) 中的数据离线同步任务、数栈-实时开发平台(StreamWorks)中的数据实时采集任务已经统一基于F X来实现。数据的离线采集和实时采集基本的原理的是一样的,主要的不同之处是源头的流是否有界,所以统一用F 的Stream API 来实现这两种数据同步场景,实现数据同步的批流统一。
1、功能介绍
断点续传
断点续传是指数据同步任务在运行过程中因各种原因导致任务失败,不需要重头同步数据,只需要从上次失败的位置继续同步即可,类似于下
继续阅读与本文标签相同的文章
-
Dubbo 常见错误及解决方法
2026-05-17栏目: 教程
-
超大规模商用 K8s 场景下,阿里巴巴如何动态解决容器资源的按需分配问题?
2026-05-17栏目: 教程
-
分布式架构全方位立体无死角解析
2026-05-17栏目: 教程
-
云栖干货回顾 |“顶级玩家”集结!分布式数据库专场精华解读
2026-05-17栏目: 教程
-
云cassandra 重磅发布dynamodb特性
2026-05-17栏目: 教程
