投稿邮箱:price@chinadevelopment.com.cn
  • 点击搜索

结合大数据,提升价格监测预警工作水平

2018-08-31 09:06     中国经济导报

QQ截图20180831090322

赵公正 宋傅天

价格监测预警工作是维持价格稳定的基础性工作,是服务宏观调控的重要内容之一。近几年来,我国大数据技术逐步发展,已在医疗、工业、金融等众多领域得到应用,社会和经济效果良好,这也为价格监测预警工作提供了新思路。

2015年8月,国务院发布《促进大数据发展行动纲要》,对大数据建设指明了方向。然而,大数据技术也存在天然缺陷与不足,就价格监测预警工作的重要性而言,传统方法结合大数据技术,将是当前和今后一段时间内做好价格监测预警工作较好的发展方向。

数据广泛、分析方法先进是优势

大数据技术是将互联网、物联网、移动终端、工业传感器等软硬件设备所生成的结构化、半结构化及非结构化数据,通过数据挖掘、人工智能、预测分析等方法,获取、处理、应用大规模异质性信息,为价值创造、公共服务、科学研究等提供支撑。

大数据技术有大量、多样、高速和价值四个特点,需要海量、多领域数据为基础,包括多种数据类型如结构、半结构与非结构数据,且要求高速的数据处理速度。在价值方面,大数据本身价值密度低,需要通过数据挖掘等方式获取有价值的信息。

大数据技术开创了研究经济数据的新方式,其不需要预先的经济建模,只需要将数据进行大量运算,就能得到变量间的相关关系,从而寻找到未被发现的变量关系。

大数据技术作为一种现代方法,如能将其应用在价格监测预警工作中,将带来众多优势。

其一,监测数据来源广泛。

大数据方法可应用新渠道获取数据。与传统方法较为接近的是大范围寻找新变量作为价格预测的因素。如国外学者认为交通流量可以反应经济的活跃程度,以德国收费站的相关记录作为生产指数的先行指标,其结果证实能够提前反映官方记录。又例如,利用互联网搜索数据。国内有相关研究,是通过网络搜索数据进行房价预测。研究以北京、上海等16个大中型城市的二手房与新房价格为研究对象,以百度搜索关键词如房价走势、房源、房贷利率等搜索指标作为变量之一,利用随机森林与支持向量机等新技术方法进行建模,其预测效果明显好于线性方法且预测时间提前,比官方发布提前约2周的时间。

此外,现代计算机技术能够高效、自动获取网络数据。典型的网络爬虫技术通过程序脚本的设定,可自动访问并下载海量网络信息。国内学者曾以网络爬虫,高效而低成本的收集土地交易价格等信息,并在此基础上进行研究。网络爬虫的自动化、大范围的数据采集能力同样可以用于收集半结构、非结构数据。

其二,可分析多种类的数据,大数据能够处理半结构与非结构数据,如文字、图片、视频等用于预警分析,从而引入多于结构性数据近十倍数据量的半结构与非结构数据,这是对监测预警工作的本质提升。

当前,主流的研究是通过大量文字信息如网络日志、搜索历史等分析公众行为,为价格监测预警提供发展方向。如根据公众发布的内容进行分析,最终结果证明引进公共情绪作为影响因素能有效提高价格预测的准确性。也有外国研究基于亚马逊网站评论内容,运用词袋模型等方法进行文本分析,其结果证实模型加入用户评论因素有显著正向预测效果,且能提前一周完成预测。

随着人工智能等领域的进步,大数据技术对图片、声音、视频等形式的数据分析将趋向成熟,这将对价格监测预警工作带来深远的影响。

其三,预警分析方法先进

大数据可发现新预警因素。相比传统方法,大数据能够在海量、多领域的因素中发现新的相关关系,为后续分析指出方向。新技术、新商业模式的创新将导致原有预警因素效果逐步下降,大数据方法以发掘新变量相关性的方式,为价格监测预警工作者揭示新的因果关系。如有学者利用大数据方法对猪肉价格开展研究,分析各种预警因素和重要性,利用大数据方法进行排序,能提高预测的精度。

大数据预警模型的效果更深层、更全面。随着现代计算机科学的发展,神经网络等方法现已广泛运用于研究中。如国内研究利用神经网络等方法,对粮食价格进行预测,预测误差仅为2%左右。相比传统方法所表现的简单线性、单一变量效果之外,大数据方法对于研究价格形成因素的非线性关系、多场景影响等具有更深层、全面的预警表现。

大数据预警仍有不足

大数据技术作为新兴方法之一,虽有众多优势,但也存在先天不足。价格监测预警工作者需要全面了解大数据特点后,结合传统方法才能做出合理的判断。

若仅使用网络数据而非专业数据库信息进行大数据分析,可能存在数据偏误。网民作为信息提供者不同于具有代表性的经济个体,其提供的信息既不具有完整的代表性,又有客观性存疑。

一方面,网络信息代表性受限。网络信息无法代表整体经济的信息,受限于网民构成低龄化、网络信息生活化。对于大数据价格监测所需要的金融信号、生产消费信息、技术自然冲击等广泛多角度的信息并不切合。另一方面,由于网络匿名性,网络情绪化导致信息客观性存疑。同样,网络炒作也会加深数据客观性的疑问。因此如何解决网络信息的真实性客观性问题,是价格监测预警工作者需要考虑的。

此外,大数据仅能发现统计相关性而非内在因果性。大数据获取的变量关系并非出自经济模型的内在机制,而是通过建立复杂的计算机算法模型并直接输入海量数据和结果变量,评估变量之间的统计关系。即是说,这些变量的统计关系可能仅仅是数据与结果的统计结果,并不一定是经济上的均衡关系,甚至没有内在经济关系。特殊情形下,所发现的新变量与新关系可能只是统计上的“巧合”。

若无经济理论支撑而仅基于统计关系,预警效果将逐渐下降。第一次政府可以成功预警,但此后经由大数据所得出的统计相关性将被公众发现,公众可以利用这一统计关系,改变原有行为以提高自身效用。随着知晓该关系的人数增加,公众行为的变化将逐渐导致原统计相关关系发生变化,使得相应的预警失效。

新旧结合提升价格监测预警工作水平

当前传统价格监测的数据搜集主要利用人工典型调查并逐级上报的方式,价格预警工作的数据处理也主要是以平均数建立时序结构化模型的方式,存在监测数据质量相对较低、模型预警精度不高以及相对滞后等缺陷,大数据的广泛性、多维性、实时性以及分析技术的先进性正好弥补传统方法存在的问题。

其中加强大数据库建设是应用大数据技术的重要环节。只使用网络监测数据可能出现数据偏误。因此需要建设具有专业、海量且多领域的价格大数据库以用于价格预警分析。一方面优化原有的典型调查方式,另一方面将每个采样数据的位置、品质、规格等商品信息和产业链的产供需等情况全面记录,扩充大数据库内容。

此外,现有价格监测预警模型也需纳入大数据技术。

大数据技术能够发现新变量关系,但只提供统计相关性,应将大数据技术与原有传统预警模型进行比较,深入分析内在差异并互相改进。在结合的过程中,需要价格监测预警工作者分析价格形成的内在机制,需要对新变量关系做出经济上的合理性分析,如新变量是否只是统计“巧合”而与生产消费无关、新变量对消费侧与供给侧的影响、预警措施的后续影响等研究,还需要不断的利用大数据对变量关系进行动态更新,并发现新变量关系。综合各方面的影响后,才可构建预警模型并完成预警。

大数据技术方法应用众多,发展迅速且技术先进,而传统价格监测预警方法在小范围、单一商品和迅速、有效性上也有明显的优势。价格监测预警工作者需要在其中广泛比较、深入研究并谨慎选择,并研究如何将两者充分结合起来,发挥各自优势,提升工作水平。例如,使用大数据方法前需对数据进行综合评估,以确定数据的准确性、真实性;在引用大数据预警结论前需验证在理论上的合理性与可用性;对外部公布时,应考虑社会影响并切实保证价格预警的客观性,维持政府公信力。

(作者单位:国家发展改革委价格监测中心)

【责编:高杨】
  • 微笑
  • 流汗
  • 难过
  • 羡慕
  • 愤怒
  • 流泪
相关文章