按照上篇文章《解锁云原生 AI 技能 | 在 Kubernetes 上构建机器学习系统》搭建了一套 Kubeflow Pipelines 之后,我们一起小试牛刀,用一个真实的案例,学习如何开发一套基于 Kubeflow Pipelines 的机器学习工作流。
准备工作
机器学习工作流是一个任务驱动的流程,同时也是数据驱动的流程,这里涉及到数据的导入和准备、模型训练 Checkpoint 的导出评估、到最终模型的导出。这就需要分布式存储作为传输的媒介,此处使用 NAS 作为分布式存储。
- 创建分布式存储,这里以 NAS 为例。此处
NFS_SERVER_IP需要替换成真实 NAS 服务器地址
- 创建阿里云 NAS 服务,可以参考文档
- 需要在 NFS Server 中创建
/data
# mkdir -p /nfs# mount -t nfs - 继续阅读与本文标签相同的文章
上一篇 :
你的企业用SaaS软件了吗?
下一篇 :
设备使用HTTPS协议接入IoT物联网平台
-
【java并发】Semaphore 的使用
2026-05-22栏目: 教程
-
并发编程工具之一:CountDownLatch 用法
2026-05-22栏目: 教程
-
一年节省带宽费近万元!阿里云虚拟主机再次免费升级
2026-05-22栏目: 教程
-
ThreadPoolExecutor里面4种拒绝策略
2026-05-22栏目: 教程
-
PostgreSQL体系结构
2026-05-22栏目: 教程
