随机选择一幅照片,你恐怕很难迅速判断出照片拍摄的地理位置,除非照片与知名地标性建筑或风景名胜相关。虽然如此,人类在此类任务上其实很擅长,他们能综合各种线索和信息识别位置。机器被认为不擅长此类任务,但Google的新深度学习神经网络PlaNet 改变了这一切,它能根据像素判断几乎任何照片的地理位置。Google的研究人员利用了卷积神经网络和长短期记忆方法,使用不同的视觉线索去改进识别率。研究人员将地球表面分割成数万个不同大小的正方形,使用了上亿幅照片的数据集去训练PlaNet。对 Flickr上的230万幅照片的测试显示,3.6%的照片PlaNet的地理位置识别能达到街道级别的精度,10.1%的照片能达到城市级别的精度。他们的论文(PDF)发表在预印本网站arxiv上。
时间:2016-02-27 22:25
来源:Solidot
作者:AnkhMorpork
原文链接