2022-06-16 20:00-21:00
线上
云原生数据工厂——中海庭数字化转型之路
分享内容简介
本次分享将会介绍中海庭在业务上引入以及实践云原生技术的过程,作为实例会讲解 Argo 结合 KubeSphere 在数据处理上的应用实践。
讲师简介
郭杨斌,中海庭云端平台科室经理,原东风畅行斑马快跑架构负责人。
许维明,中海庭云端平台架构师,原 IBM DevOps 架构师。
分享大纲
直播时间
2022 年 06 月 16 日 20:00-21:00
直播地址
B 站 http://live.bilibili.com/22580654
PPT 下载
可扫描官网底部二维码,关注 「KubeSphere云原生」公众号,后台回复 20220616
即可下载 PPT。
Q & A
Q1:大数据调度系统选型有哪些?比如 DolphinScheduler/Airflow,Oozie,Kettle 之类的。他们各自优势有哪些?我想做一个能够支持实时数据、离线数据依赖调度、数据血缘关系、数据映射同步、在线开发编辑等集大成的系统。对应这些功能点应该选择哪些开源系统?
A:简单的做个对比。
工作流引擎 | 优势 | 不足 |
---|---|---|
airflow | 老牌任务管理、调度、监控 | 语言强绑定,Python 依赖 |
K8s native workflow | 简单直接 | 灵活度不够 |
Apache Dolphin Scheduler | 界面友好,任务定制简单 | API 不太友好,模板编排不太灵活 |
Argo Workflow | 容器编排灵活、模板编排支持模块化、与云原生结合紧密 | 目前还在快速迭代中,用于生产有一定的风险,中文资料不足 |
Q2:Argo 最佳实战的 simple 地址麻烦老师给一下
A:这个是官方的例子集合涵盖了绝大部份的应用场景: https://github.com/argoproj/argo-workflows/tree/master/examples。
这个是我个人的 Argo 工作流使用例子集合,目前包括了 dag 流程,暂停/恢复流程,并行流程,串行流程,循环流程,递归循环嵌套流程: https://github.com/xwm111/argodemo。