沙坪坝区科协集中力量助力疫情防控时空伴随者的算法原理綦江区科协举行“三长”带“三会”推进会巫山县科协开展消防安全科普宣传城口县科协开展核酸采样演练重庆市气象局2025年天气预报准确率将提升至82%
第10版:科技服务·科普
上一版 下一版  
沙坪坝区科协集中力量助力疫情防控
时空伴随者的算法原理
綦江区科协举行“三长”带“三会”推进会
巫山县科协开展消防安全科普宣传
城口县科协开展核酸采样演练
重庆市气象局2025年天气预报准确率将提升至82%
     
 
重庆日报 | 重庆科技报
重庆日报报业集团主办 
3上一篇  下一篇4  
2021 年 11 月 18 日 星期 放大 缩小 默认  
科普中国

时空伴随者的算法原理

  随着抗击新冠肺炎疫情工作的持续开展,“时空伴随者”这个新名词已经为人所熟知。与新冠肺炎疫情确诊病例或者无症状感染者在同一时间段内出现在了同一社区、同一商超、同一车站机场等同一空间的人员,都有可能成为“时空伴随者”。那么,判定“时空伴随者”的算法原理是什么呢?

  时空轨迹的伴随模式

  伴随模式是时空轨迹模式中的一种,想了解时空伴随,先得了解一下什么是时空轨迹。

  时空轨迹是移动对象的位置和时间的记录序列。换句话来说,时空轨迹和时间、空间都有关联。从定义中可以看出时空轨迹是连续的,但由于硬件的限制及其他原因,通常时空轨迹的采样点是离散的,因而通常时空轨迹也是以离散的方式表示。

  而在所有的时空轨迹模式中,有一种模式是指一群移动在一个限定的范围内,一起移动至少特定时长的运动模式,这样的一种运动模式就叫伴随模式。例如,从同一个学校放学后回到同一个小区的学生,一起上下班的同事等,都会产生在伴随模式下相似的时空轨迹。

  作为一种重要的时空对象数据类型,时空轨迹的研究涵盖了人类行为、交通物流等诸多方面。通过对各种时空轨迹数据的挖掘、计算与分析,可以得到时空轨迹数据中的相似性异常特征,有助于发现其中有意义的轨迹模式。

  如何挖掘伴随数据

  那么,如何把这些时空轨迹中的伴随数据从大数据中挖掘出来呢?时空伴随需要综合时间维度和空间维度,所以目前主要依靠的是电信运营商的移动电话基站信号数据。

  时空轨迹数据可以来自不同感知设备的许多采样记录。目前可利用的数据形式主要包括城市车辆通行数据(道路监控),出租车轨迹数据(GPS采样),以及传感器搜集的数据(手机和基站的通信)。基于基站数据的伴随又分为两种。一种是基于经纬度的伴随,在明确知道每个基站精确经纬度的前提下,使用GEOHASH(经纬度编码)算法的方式处理。但是在实际情况下,基站的经纬度数据经常存在不全或者误报,会对伴随精准度造成影响。另一种则只需根据基站的信号数据来挖掘伴随对象,这种方法依靠电信运营商的lacci(大小区编号)数据,就可以比较全面且精确地定位对象是否处于伴随模式。

  除了以上方式,近年来随着基于位置的社交软件的推广,还产生了大量带有时空标签的定位数据,很多研究就是利用这些定位数据进行时空轨迹的挖掘。

  数据挖掘的应用

  从大量数据集合中发现特定信息和模式的过程,已经形成了专业的算法领域,名叫数据挖掘。数据挖掘常用的算法手段有回归、分类、聚类和模式发现等。

  对伴随模式下时空轨迹进行数据挖掘,除了在抗击新冠肺炎疫情的工作中发挥重要作用,也能在安全驾驶行为检测、路网挖掘、交通管理、地理画像、出行模式分析、资源分配等领域有着重要的应用。例如,网约车在提供出行服务过程中积累了海量的时空轨迹数据,网约车公司能从中提取关键信息,了解诸如司机未能按照导航路线行驶而出现路线偏移等现象的原因,从而改善用户出行体验等。另外,工程上数据挖掘通常和大数据技术联系在一起,工业实践中还需要从业人员对数据中包含的领域知识有足够了解。业界挖掘手段经常用在用户画像、商业智能、社群关系发现等场景。

  从某种角度讲,时空伴随者的数据挖掘及算法是一门交叉学科,需要从业人员具备统计、机器学习、大数据乃至高并发后台服务、数据可视化等复合技能。(本报综合)

3上一篇  下一篇  
 
《重庆科技报》版权所有 未经书面授权 不得复制或建立镜像
地址:重庆市渝中区双钢路3号科协大厦 邮编:400013
技术支持:北京北大方正电子有限公司