在今年的Spark+AI峰会上,MLflow团队推出了MLflow,一个开源的用于简化机器学习生命周期的平台。从首次发布到现在的三周时间里,已经有很多数据科学家和工程师对使用MLflow和为MLflow贡献代码感兴趣。MLFlow的GitHub仓库已经有180个分支,其中有十几个贡献者提交了问题和拉取请求。此外,上周参加由该团队举办的第一次MLflow聚会的人数接近100人。
昨天,该团队正式宣布推出MLflow 0.2版本,这一版本包含了由内部客户和开源用户提出的一些最被期待的功能。按照MLflow快速入门指南给出的提示,可以使用pip install mlflow来安装MLflow 0.2。以下内容将介绍该版本的主要新功能。
内置TensorFlow集成
MLflow让开发者可以基于任意机器学习库进行模型训练,只要可以将它们包装在Python函数中,但对于常用的库,MLflow团队希望能够提供内置的支持。该版本增加了mlflow.tensorflow包,借助这个包,开发者可以轻松地将TensorFlow模型记录到MLflow跟踪服务器中。在记录模型之后,可以立即将其传给受MLflow支持的各种部署工具(例如本地REST服务器、Azure ML服务或Apache Spark)。
以下示例显示了用户如何记录经过训练的TF模型,并使用内置功能和pyfunc抽象进行部署。
训练环境:保存训练过的的TF模型
# 将estimator保存成SavedModel格式。
estimator_path = your_regressor.export_savedmodel(model_dir,
receiver_fn)
# 记录导出的SavedModel。
# signature_def_key: 签名的名称,在加载SavedModel时使用
# 参考:
(https://www.tensorflow.org/serving/signature_defs).
# artifact_path: 保存构件的位置
mlflow.tensorflow.log_saved_model(saved_model_dir=estimator_path,
signature_def_key="predict",
artifact_path="model")
部署环境:加载TF模型并进行预测
estimator_path = ... # 保存TF的位置
# 我们可以加载TensorFlow estimator并包装成一个Python函数。
# 可以使用本地文件或传进去一个ID加载上一次运行的构件。
pyfunc = mlflow.tensorflow.load_pyfunc(estimator_path)
# 将模型应用在Pandas DataFrames上进行预测。
predict_df = pyfunc.predict(df)
生产跟踪服务器
MLflow 0.2增加了一个新的mlflow server命令,该命令将启动MLflow跟踪服务器的生产版本,用于跟踪和查询运行过的实验。与本地的mlflow ui命令不同,mlflow server可以支持多个工作线程和基于S3的存储,如下所述。读者可以阅读MLflow文档以了解如何运行跟踪服务器。
基于S3的构件存储
MLflow的一个关键功能是记录训练的输出,其中可能包括被称为“构件”的任意文件。不过,MLflow的第一个版本仅支持将构件保存到共享的POSIX文件系统。MLflow 0.2添加了对S3存储的支持,通过给mlflow server命令添加—artifact-root参数即可。这样可以轻松地在多个云实例上运行MLflow训练作业并跟踪结果。以下示例说明如何启动使用S3存储的跟踪服务器。
在EC2实例上运行MLflow服务器:
% hostname
ec2-11-222-333-444.us-west-2.compute.amazonaws.com
% mlflow server \
--file-store /mnt/persistent-disk/mlflow_data \
--artifact-root s3://my-mlflow-bucket/
MLflow客户端:
mlflow.set_tracking_uri("http://ec2-11-222-333-444.us-west-2.compute.amazonaws.com")
...
with mlflow.start_run():
mlflow.log_parameter("x", 1)
mlflow.log_metric("y", 2)
...
mlflow.log_artifact("/tmp/model")
其他改进
除了这些较大的功能之外,该版本还包含了一些错误和文档问题的修复。完整的变更列表可以在CHANGELOG中找到。读者可以在mlflow-users@googlegroups.com上提供更多反馈,或在GitHub上提交问题或补丁。要想实时讨论有关MLflow的问题,可以加入MLflow的Slack频道。
MLflow的下一步会做什么?
MLflow团队计划在alpha版本中继续更新MLflow。例如,该团队正在进行的工作包括与更多库(如PyTorch、Keras和MLlib)的集成,并进一步改进跟踪服务器的可用性。有关MLflow下一步工作的概述,可查看上周MLflow聚会的演示文稿,或直接观看聚会视频。
对于想要尝试托管版MLflow的Databricks用户,可以在databricks.com/mlflow上注册。
相关链接:
MLflow Github地址:https://github.com/databricks/mlflow
MLflow快速入门指南:https://mlflow.org/docs/latest/quickstart.html
如何运行跟踪服务器:https://www.mlflow.org/docs/latest/tracking.html#running-a-tracking
MLflow 2.0变更日志:https://github.com/databricks/mlflow/blob/master/CHANGELOG.rst
MLflow Slack频道:https://tinyurl.com/mlflow-slack
MLflow首次聚会演示幻灯片:https://www.slideshare.net/databricks/introduction-fo-mlflow
转自 http://www.infoq.com/cn/news/2018/07/MLflow-02