查看: 1023|回复: 0

OSM – OpenStreetMap数据介绍

[复制链接]
发表于 2022-11-10 12:54:27 | 显示全部楼层 |阅读模式
OSM是当今世界上最成功也是应用最广泛的志愿地理信息(Volunteer Geographic Information, VGI)空间数据库。

与只能浏览和下载的Google Map不同,它的概念类似于Wiki百科——任何人都可以编辑,上传,构造属于自己的空间数据库。任何参与者都可以向其提供地理数据,并且任何人都可以编辑其现有数据。

因此,它最大的优势在于其庞大的贡献者群体,涵盖了地理与信息技术专业的整个范围:从初学者到专家级的地理学家或软件开发人员[1]。

OSM – OpenStreetMap数据介绍-8360

1. OSM数据来源



OSM作为志愿地理信息数据库,除了用户自行上传的数据,还包括了一些免费公开的官方数据库。

在OSM的Potential Data sources 中查询到(https://wiki.openstreetmap.org/wiki/Potential_Datasources),OSM包含了以下的官方数据库:

全球     

美国中央情报局世界数据库

全球开放地理数据库

地球观测实验室NCAR

自然地球

Esri社区地图AOI(Area of Interest)

世界港口位置和数据库

Berkeley BioGeo 数据集

ICEDS欧洲数据服务器

联合国海洋法

……

地方(按国家分类,以下为举例)   

-阿根廷

    阿根廷共和国空间数据基础设施

    国家地理研究所

-加拿大   

    联邦政府提供的公路、铁路、水文网络、地形图

    此外每个州都有自行提供的数据

-美国

    美国林务局

    美国国家公园管理局

    美国地质调查局

    美国国家水文数据集

    *美国的数据较为完整。除覆盖全国的官方数据库,每个州也有独立上传的数据库

-中国

    没有官方数据库的版权。

    *可在全国地理信息资源目录系统下载1:100万的数据集(网址:http://mulu.tianditu.gov.cn/main.do?method=index)。经比对,OSM在小尺度的城市范围内道路网数据要比1:100万数据集完整,但属性不全,且OSM的中国中西部数据也不是很完整。因此在大尺度范围内可考虑使用1:100万数据集,城市尺度的道路网数据可以考虑OSM。



2. OSM数据质量



OSM目前没有一套单一的衡量标准来控制数据质量。OSM的数据质量,以及对特定应用、目的或用例的适用性,在很大程度上取决于所解决问题的特征。因此,将OSM的POI作为数据源的文献有很大一部分都是在探讨评估数据质量的模型和方法,如下例:

1) Comparison of the accuracy of OpenStreetMap for Ireland with Google Maps and Bing Maps[2] 评估爱尔兰地区OSM地图的准确性——与Google Map和Bing Map的比较:

该文献通过在地表覆盖,土地利用现状和地表物体定位精度三个方面对比了三种地图的精度,结果显示,OSM地图中“没有人绘制的区域”是最大的障碍,则该地区的数据严重缺失。另外,在地图准确性方面,Google Map最为准确,但OSM更新最及时。

2) OSM POI Analyzer: A platform for assessing position of POIs in OpenStreetMap[3] 一种评估OSM中POI位置准确性的软件:

软件开发人员利用GIS中的欧氏距离计算法将实际距离与OSM中的POI位置进行比较,判断其位置的准确性;

OSM – OpenStreetMap数据介绍-1454

巴黎的803个ATM机位置点  

及其缓冲区(根据OSM的POI数据)

3) Assessing the Accuracy of Crowdsourced POI Names[4] 评估众包POI名称的准确性:

将OSM中POI名称与参考数据集中的对应信息进行匹配,评估其准确性;

4) Defining Fitness-for-Use for Crowdsourced Points of Interest (POI) [5] 众源POI数据的适用性定义:

该论文提出了一种方法,从POI的位置和属性两个方面评估研究所需POI数据的可用性。

OSM – OpenStreetMap数据介绍-5228

OSM路网数据示例



3. OSM数据应用



由于OSM的POI数据质量不能够被保证,因此,在实际研究中,OSM中的POI数据常常不是唯一的数据源。研究者常常将其与遥感图像结合分析土地利用分类,或与其他地理数据结合做的城市功能区划分。有关旅游与城市研究相关的文章很少,仅以下列三篇为例:

1) Using OpenStreetMap as a Data Source for Attractiveness in Travel Demand Models[6] 以OSM的POI作为数据源的旅游吸引力模型:

在处理数据之前做了数据可用性检查,通过与官方数据库和历史OSM数据库做比较,确保数据可用性。其次,利用访客数据(来源当地政府和该POI的汇报)构造旅游吸引力模型,并用2020年的OSM数据和2008年的OSM数据分别生成了模型,计算其吸引力的变化。

2) Using OpenStreetMap point-of-interest data to model urban change—A feasibility study[7] 利用OSM的POI数据模拟城市变化——一项可行性研究:

该文章并不是提出一种利用POI数据模拟城市变化的模型,仅仅是评估了它在该项目上应用的可行性。该论文研究了POI数据的准确性、覆盖范围和趋势研究价值。作者使用了另一套准确的数据源(Foursquare)来评估POI的标签相似性和位置准确度。该研究以曼哈顿咖啡店的POI为例,测试了一系列的时空统计模型,并比较了时间序列上不同区域咖啡店数量与房租的变化。该论文结论是,虽然POI数据不总是完全准确,但仍然在模拟城市变化的研究中存在应用价值。

3) Recommending Travel Packages Based on Mobile Crowdsourced Data[8] 基于移动众源数据的旅游推荐包:

本文提出了一个旅游套餐推荐系统(应用软件)。利用以往用户签到数据(包含了签到位置、POI标签信息、照片),根据用户偏好及位置相关性、旅行出发点、旅行时间等生成个性化的旅行推荐线路,如更好的风景或更多的休息点等。



4. 小结



OSM作为众源空间数据库,较常被使用的是路网数据,因为OSM路网数据准确性更高,更新更及时,在中小尺度下可直接用于城市交通及可达性相关的研究。

但是相比之下,POI数据的应用还较为局限,当前以OSM中的POI作为数据源的文献,多数是在探讨其准确性,鲜见直接且单独使用该数据的论文。造成这个问题的主要原因是OSM-POI数据来源广泛且不可控,且个人上传POI时GPS定位方式不完全统一,测量存在偏差,也可能会因为上传者根据个人偏好修改POI的标签值。因此,要应用OSM的POI数据,需要进行谨慎的评估之后,才可以使用。

参考文献

[1] Mooney, P and Minghini, M. 2017. A Review of OpenStreetMap Data. In: Foody, G, See, L, Fritz, S, Mooney, P, Olteanu-Raimond, A-M, Fonte, C C and Antoniou, V. (eds.) Mapping and the Citizen Sensor. Pp. 37–59. London: Ubiquity Press. DOI: https://doi.org/10.5334/bbf.c. License: CC-BY 4.0

[2] Ciepłuch, Błażej, et al. "Comparison of the accuracy of OpenStreetMap for Ireland with Google Maps and Bing Maps." Proceedings of the Ninth International Symposium on Spatial Accuracy Assessment in Natural Resuorces and Enviromental Sciences 20-23rd July 2010. University of Leicester, 2010.

[3] OSM POI Analyzer: A Platform for Assessing Position of POIs in OpenStreetMap In: D. Li, J. Gong, B. Yang, H. Wu, L. Wu, Z. Gui, X. Cheng, H. Wu, S. Li, R. Lindenbergh, J. Boehm, M. Rutzinger, W. Yao, M. Weinmann, Z. Kang, K. Khoshelham,M. Peter, L. Díaz-Vilariño, W. Shi, B. Lu, H. Abdulmuttalib, M. R. Delavar, T. Balz, B. Osmanoglu, F. Rocca, U. Sörgel, J. Zhang, P. Li, S. Du, L. Zhao, X. Lin, K. Qin, C. Kang,X. Li, C. Chen, R. Li, G. Qiao, H. Wu, and C. Heipke (ed.), ISPRS Geospatial Week 2017 (pp. 497-504).

[4] Abuabat, Abdulelah A., Mohammed A. Aldosari, and Hassan A. Karimi. "Assessing the Accuracy of Crowdsourced POI Names." WEB 2018 (2018): 34.

[5] Jonietz, David, and Alexander Zipf. "Defining fitness-for-use for crowdsourced points of interest (POI)." ISPRS International Journal of Geo-Information 5.9 (2016): 149.

[6] Klinkhardt, Christian, et al. "Using OpenStreetMap as a Data Source for Attractiveness in Travel Demand Models." Transportation Research Record (2021): 0361198121997415.

[7] Zhang, Liming, and Dieter Pfoser. "Using OpenStreetMap point-of-interest data to model urban change—A feasibility study." PloS one 14.2 (2019): e0212606.

[8] Yu, Zhiwen, et al. "Recommending travel packages based on mobile crowdsourced data." IEEE Communications Magazine 52.8 (2014): 56-62.

撰稿:刘心怡

审核:刘逸

编辑:谢芷莹

OSM – OpenStreetMap数据介绍-6155

长按识别二维码关注我们
您需要登录后才可以回帖 登录 | 加入联盟

本版积分规则

快速回复 返回顶部 返回列表