文献综述(或调研报告):
随着信息时代到来,大数据的研究已经目前行业与学术界的研究热点之一,大数据具有多数据形式、大数据量、数据传输快捷等优势,大数据已经逐渐影响和改变人们解决问题的思维方式。除了数据本身的价值,人们同时也关心原本数据下的深层知识,或者更看重深层知识,不同数据之间的关联关系,数据分类、聚类以及异常点发现都是数据挖掘的重要方法。
而国内外关于POI类型和大数据的居民出行规律研究都有着重要的进展。
(一)国外研究:
等人(2008)提出了网络核密度估计方法预测了空间点事件,以线性像素代替了空间网络,提高了在网络空间中规则空间位置系统筛选,同时通过提高计算效率使网络核密度估计在实际应用中更加可行。通过比较,发现核密度方法对构建网络空间密度模式影响较小。因此,本选题将通过核密度估计进行聚类分析,保证聚类结果更加有效和准确。
等人(2013)讨论了时间变化对POI点的影响,结合用户时间签到行为和用户距POI点的地理距离影响。考虑了不同时间段内用户间的相同位置签到的相似性,考虑了用户在一个POI点签到后下一个POI点的可能性,用距离指数函数表示不同时间段内地点的受欢迎度,结合不同时间段和地理距离远近的综合得分,对最适合的位置候选点进行分级推荐。同样的等人(2011)也探索用户行为,社会影响,地理影响对POI点的推荐。通过分析用户和朋友的签到特点,用户间的相似性,以及地理位置函数相似性。综合用户间距离远近概率,用户和朋友间相同签到活动概率,结合当前位置的下一位置推测概率,得到位置推测概率。
国外研究多基于POI和用户行为、社会影响、地理因素、时间变化对用户下一个签到地点进行预测的分析。而上述关于网络核密度估计方法和对不同时间段用户签到行为与到POI距离的影响的分析,对研究居民的出行需求提供了重要思路和关键方法。
在以上研究的基础上,为提高下一个签到点(POI)预测的精度,众多研究者运用了各种研究方法进行探索。等人(2013)提出GT-BNMF(Geographical-Topical Bayesian Non-negative Matrix Factorization)模型,结合用户和话题潜在因素,事件和话题潜在因素,用户和话题分布,事件和话题分布,将话题空间转化为潜在空间抓取观察特征和话题事件的关联。等人(2013)提出factorized personalized Markov chains Localized Region(FPMCLR)模型, 提高计算速度,减少噪声。等人(2014)提出地理因式矩阵法(Geographical Modeling and Matrix Factorization,GEOMF),结合地理模型和因式矩阵,可帮助分析如何推荐POI位置,以及解释空间聚类模型,解决矩阵稀疏问题以及提高计算效率和精度,用投影梯度下降法解决边界限制的最小平方问题。
(二)国内研究:
国内的研究主要有POI分布特征,一是结合道路的POI网络核密度分析城市功能区和城市行业分布,二是结合人类移动模式、签到人数、微博签到数据、道路网络、Smart Card Data(SCD)和POI数据识别出城市的功能区以及分析商圈分布、零售业聚集空间分布。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。