微软在2月18日提供一个预览版的Azure HDInsight(Hadoop on Azure)服务,运行在Linux操作系统上。
与对应的Windows一样,Azure HDInsight on Linux服务也是构建在Hortonworks Data Platform(HDP)之上。HDInsight与Apache Hadoop全面兼容,同时集成了微软自己的商业智能工具,例如Excel、SQL Server和PowerBI。正如对Windows版本所做的,微软计划将针对Linux HDInsight版本开发的后端代码贡献给Apache社区,微软方面这样表示。
更新:目前HDInsight支持的唯一Linux版本是Ubuntu(在虚拟机中),是由Canonical提供支持的。
新的HDInsight on Linux预览版只是微软在圣荷赛举行的Strata + Hadoop大会上多个大数据相关公布的其中一个。其他公布还包括:
- 微软现在已经开始提供Storm for Azure HDInsight。Storm是一种开源的流分析平台,已经从2014年10月开始针对Azure HDInsight进行预览。
- 微软的Azure机器学习服务现在已经全面提供。微软在去年6月预览了Azure ML,允许开发者和数据科学家更快速地构建和部署应用,并且能够访问应用编程接口和服务,例如推荐、异常检测以及预测,通过Machine Learning Marketplace。
- 微软将使用Hadoop连接器把自己的NoSQL Azure服务、DocumentDB与HDInsight进行集成。这使得DocumentDB要么是运行Hadoop查询的一个输入源,要么是输出Hive、Pig和MapReduce工作可以发送到的地方。
- 数据集成提供商Informatica已经支持在Azure上的Linux和Windows Server虚拟机中提供自己的Informatica Cloud Agent技术。Informatica通过Azure Marketplace提供Cloud Agent,实现Informatica技术和各种Azure数据服务之间的连接。
微软方面还表示,这些新产品作为微软不断扩充的服务组合将旨在帮助用户从他们的数据中获得更多信息。
“我们希望让Azure成为数据的最佳保存地。”微软数据平台企业服务总裁T.K. “Ranga”Rengarajan这样表示。
在定价方面,支持Storm的HDInsight集群将达到标准的HDInsight率,细节在这里。
目前Azure机器学习预览定价将从2015年3月31日开始生效。从2015年4月1日开始,所有新的和现有的Azure机器学习订购用户都将自动转换到标准版本,相应计费,不需要用户干预。那些不希望迁移的现有用户可以在2015年4月1日开始删除他们的工作区。
从Azure网站提供的免费版Auzre机器学习没有变化也不收费,微软方面这样表示。