2016年,AI在企业中的应用情况达到了怎样的程度?在12月的一篇Hacker News讨论帖中,诸多网友分享了其公司内部应用机器学习技术的情况。
数据的清洗、统计、建模、预测
为了追热点,这年头的大部分数据公司都说自己的产品服务用了机器学习。这相当引人争议——比如,线性回归算是机器学习吗?有人说是,因为机器学习的教程就是从线性回归开始的;有人说不是,因为这种基本的统计计算早在“机器学习”这个概念出来之前就有人在用了。
到底,怎样的系统有资格被称为“机器学习”系统呢?有人搬出了Tom Mitchell的一段定义:
"A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E."
比如你写了个下棋的程序,然后让它天天自己跟自己下棋玩;过了一段时间,如果你发现它的棋力提升了,那就证明它具备学习能力。同理,如果你写了一个预测的程序,然后让它天天看各种历史数据;过了一段时间,如果你发现它的预测准确率提升了,那就证明它具备学习能力。(不过反过来,这样的定义却无法证明一个系统不具备学习能力……)
有些数据处理系统并不具备学习功能。很多数据处理系统并不需要具备学习功能。不过,机器学习的能力正在越来越多的应用到数据处理的场景中,这是毋庸置疑的。尤其在金融行业,制作风险模型、进行花费预测、损失预测,都有广泛的应用。比较有趣的是有人提到Numerai,这里聚集了一大批给股市建模的数据科学家,大家把自己的预测拿出来公开比赛。
此外,有一个用户 @splike 表示他们的系统可以预测一次基因编辑操作(CRISPR)的有效程度。还有一个叫做Queckt的系统可以预测一个JIRA工单需要多久能被解决。(话说这系统是要用来对付产品经理的么……)
客户管理 KYC
几乎半数的回复都涉及客户管理方面的应用,如:
- Amazon Personalization,亚马逊的个性化推荐系统
- Coursera的个性化课程推荐系统
- 预测客户流失,如AppURI
- 金融/电信行业反欺诈服务,如SkyMind
- 从众多的客户留言中自动筛选出那些“不高兴的客户”
模式识别
- 有一位来自制造业的用户 @altshiftprtscrn 表示他们用声学显微镜进行次品检测,用决策树模型提升系统识别次品的正确率
- @strebler 就职于一家计算机视觉公司,该公司开发了几个针对零售商的产品,可以根据图像自动识别商品并提供后续服务
- Sumo Logic,针对大规模服务器集群(主要是AWS和Azure应用)分析系统日志以协助故障排查。SkyMind也提供了类似的服务针对OpenStack部署。Graphistry也提供类似的服务
- Persyst,用神经网络学习脑电图/心电图,识别各种疾病的症状
- Qualia.ai,识别网络舆论上出现的新生热门话题
- Matterport,针对房地产行业,其系统根据摄像师提供的房屋全景照片制作3D模型与介绍视频
- Attentive.ai,针对安防摄像头拍到的录像进行分析,自动抽取其中的“异常事件”并发送报警
- Diffbot,自动抓取网页中的纯内容,移除与内容无关的页面元素。John Davi在Quora上介绍过Diffbot用来提高抓取准确度的算法
决策助理
- 用户 @iamed2 的系统能够为电网中的交互行为建模,从而提供建议以优化电网的效率。他说,“如果你很了解你的数据关系,那么机器学习也许对你是没用的。但如果你不了解你的数据关系,那么机器学习就变得很有用了。”
- 用户 @ilikeatari 的系统能够针对用户的用车历史提供建议,告诉他们何时把旧车卖掉再买入新车是最划算的。目前,他们的客户主要是美军舰队
- Optimail,邮件推广自动化,自动抓取你的网站以生成推广邮件/短信,配合强化学习算法以提升推广成功率
总结
2016年初,mldb博客上发布了一篇文章:《当机器学习遇到经济世界》(文章第二部分在此)。到2016年底,正如用户 @strebler 在帖子中所说,“AI/ML在最近这段时间的发展,真真切切的将之前的一些不可能化为了可能“。2017年,这个领域的发展将更加值得关注。