Kubeflow,名字取自 Kubernetes + Tensorflow ,是 Google 为了支持 Tensorflow 的部署而推出的开源平台。Kubeflow 旨在使 Kubernetes 上的机器学习变的轻松、便捷、可扩展,其目标不是重建其他服务,而是提供一种简便的方式找到最好的 OSS 解决方案。Kubeflow 的目标是通过发挥 Kubernetes 的特长,从而更便捷地运用机器学习:
- 在不同的基础设施上实现简单、可重复的便携式部署
- 部署和管理松散耦合的微服务
- 根据需求进行扩展
Kubeflow 于2017年底正式开源,并于2018年5月发布了首个 0.1 版本,之后陆续发布了 0.2、0.3 和 0.4 RC 版本。截至2018年12月18日,Kubeflow 已有 100 多个活跃成员,得到 30 多个组织的支持。
Kubeflow 产品管理团队近日发布了 2018 年度回顾和 2019 新年计划,并表示目前正在努力让 Kubeflow 达到第一个主要版本 1.0 。这将是项目的一个重要里程碑,计划在 2019 年上半年准备就绪。
Kubeflow 1.0 的重点将围绕:
- API 稳定;
- PyTorch 相关问题
- TFJob 相关问题
- 强大的监控和日志记录
- 扩展和负载测试
- 集成超参数调优
- 高级数据管理
往更高层面来说,Kubeflow 1.0 关注的重点包括:
- 面向企业就绪
- 改进部署和开发体验
- 实现高级 ML 工作流程
- 基础设施完善
- ……
更多细节可查阅:Kubeflow 2019 roadmap
转自 https://www.oschina.net/news/103349/kubeflow-1-0-roadmap