用于预测零售失败的社交媒体数据
研究人员将社交媒体和交通数据结合起来,预测特定零售企业成功或失败的可能性。由剑桥大学(University of Cambridge)牵头的研究人员利用来自全球10个不同城市的信息,开发出了一种模型,能够以80%的准确率预测一家新企业是否会在6个月内倒闭。研究结果将在本周于新加坡举行的ACM普及与泛在计算大会(Ubicomp)上公布。尽管零售业一直存在风险,但过去几年,随着越来越多的零售商倒闭,商业街发生了转变。研究人员建立的模型可能对企业家和城市规划者在决定业务地点或投资领域时都有用。“对于任何一家新企业来说,最重要的问题之一是它将会收到多少需求。”这直接关系到企业成功的可能性有多大。“我们可以用什么指标来做出这些预测?”
D’silva和她的同事使用了来自芝加哥、赫尔辛基、雅加达、伦敦、洛杉矶、纽约、巴黎、旧金山、新加坡和东京的基于地理位置的社交网站Foursquare的7400多万次签到;以及来自纽约和新加坡1.81亿次出租车旅行的数据。利用这些数据,研究人员根据所处街区的性质、一天中不同时段的游览模式,以及一个街区是否吸引了来自其他街区的游客,对场馆进行了分类。“我们想要更好地理解一个地方在某个时间点的预测能力,”德席尔瓦说。
企业的成败通常取决于一些可控和不可控制的因素。可控因素可能包括商店产品的质量或价格、营业时间和顾客满意度。无法控制的因素可能包括城市的失业率、总体经济状况和城市政策。他说:“我们发现,即使没有这些不可控制因素的任何信息,我们仍然可以利用特定于静脉、与地点有关和基于行动的特征来预测一家企业可能倒闭。”
数据显示,在所有10个城市中,那些24小时都很受欢迎的场馆,而不仅仅是在一天中的某个时间,更有可能成功。此外,在邻近地区其他场馆通常受欢迎的时段以外有需求的场馆,往往会存在更长的时间。数据还表明,在拥有多种商业类型的不同街区的场所,往往存在的时间更长。
虽然这十个城市有一些相似之处,但研究人员也必须考虑到它们之间的差异。“有用的预测指标因城市而异,这表明因素以不同的方式影响城市,”D’silva说。“举个例子,只有在纽约和东京,前往场馆的速度才是一个重要的衡量标准。”这可能与这些城市的交通速度有关,也可能与交通速度有关。”来测试他们的模型的预测能力,研究者首先要确定一个特定的地点已经关闭的时间窗口内数据集。然后他们“训练”模型的一个子集,告诉模型的特点这些场馆在窗口第一次和地点是否在第二次窗口中打开或关闭。然后,他们在数据的另一个子集上测试训练过的模型,看看它有多准确。
根据研究人员的说法,他们的模型显示,在决定什么时候、在什么地方开办企业时,重要的是要超越特定街区的静态特征,并考虑人们在一天中不同时间进出该街区的方式。为了提高模型的准确性,他们现在想要考虑这些特征在不同街区之间是如何变化的。
网友评论