随着传统产业的转型升级,由信息技术革命带动的、以高新技术产业为龙头的、包括利用计算机和互联网等现代信息技术进行交易的各类商务活动日益活跃,为传统产业打破发展瓶颈找到了突破口,并产生了大量多维度、高频率、可追踪的交易数据,为客观认识现实世界提供了丰富的资源,也对传统的统计分析框架提出了挑战。数据作为国家的基础性战略性资源,正发挥着引领全局、覆盖全面、贯穿始终的独特作用,引导着技术、物质、资金、人才、服务等资源各尽其用,在此背景下,需要完善统计体系,以及时反映经济运行状态,使决策部门的政策制定有据可依,助推我国经济健康发展。
“互联网+”下的数据新特征
国家现有统计制度主要通过分层、多阶段、概率比例抽样的方法获取调查样本,各有关部门以联网直报方式向国家统计局独立自行报送相关数据,通过进一步整合得到频率和指标较为固定的结构化数据。伴随着社会媒体、移动终端和传感设备等新工具的普及应用,包括文档、图片、音频、视频等在内的非结构化数据大量涌现,进一步拓宽了统计分析的数据广度及深度。具体来说,日益丰富的海量数据呈现如下特征:第一,由低频数据转向高频数据。互联网特别是移动互联网的发展,网民数量和联网设备快速增长,加快了信息化向社会经济各方面的渗透,促进数据在不同机构及个体之间加速流动,提高了数据的时效性,并使数据量级不断翻新,大数据来势凶猛;第二,由低纬数据转向高纬数据。随着获取、存储、管理、分析等数据处理能力的提升,可获得的数据维度不断多样化,并且同一主题在不同业务中的表现相互印证,为大数据征信提供便利;第三,数据的可追踪性增强。传统数据大多采用抽样调查法获取,代表性不足,数据频率低,操作周期长,而互联网为我们高频率追踪个人行为提供了可能,便于根据用户特征进行组合分类,通过用户画像实现服务创新、精准营销及供应链优化等;第四,由结构化数据转向非结构化数据。互联网的发展加速了数据的非结构化趋势,综合使用传统调查方法和文本挖掘、爬虫等新技术获取异源甚至异构数据,为多角度验证数据的全面性和可信性提供便利,同时也对数据处理能力提出更高要求;第五,数据由高价值密度转向低价值密度。数据体量越大,数据噪音也越大,导致数据价值密度降低,增加数据的处理难度,但对其进行深度挖掘可能得到的价值也更大。
2011年,英国《自然》杂志曾出版专刊指出,倘若能更有效地组织和使用大数据,人类将得到更多机会发挥科学技术对社会发展的巨大推动作用。面对“互联网+”下的数据新特征,我们需要不断提高数据的收集、存储、分析等能力,使用大数据、云计算等新技术手段进行深度挖掘,充分发挥互联网下的数据优势,实现数据由大规模到高价值的转变。
传统统计体系面临的挑战
数据源的极大丰富和新一代信息技术的完善普及进一步提升了统计的信息化水平,并赋予“统计现代化”更多内涵,经济统计体系也需要顺应潮流不断调整、完善。目前,传统的统计监测体系逐渐落后于飞速发展的电子商务经济,不能完全满足客观反映经济发展状况的要求,从统计角度看主要体现在如下方面。
从统计内容看,新一轮科技革命和产业革命催生了新产品、新服务、新产业、新业态、新模式,借助互联网实现了资源的跨时空流动,极大缩小了交易双方的沟通成本,拓展了商业空间,提高了交易效率,增大了统计数据的体量,丰富了数据来源,扩大了传统统计体系的监测范围。
从统计手段看,传统经济数据很大程度上依赖于调查统计,通常为保证准确性而牺牲时效性,存在数据滞后性、缺乏多维度衡量等问题,难以及时系统反映经济发展状态,而互联网+、大数据、云计算、物联网、智能化、传感感应技术等新技术丰富了数据处理手段,便于以接近实时的速度收集、整理和应用大量信息。
从市场规模看,微经济、平台经济、共享经济及跨境经济等不同交易模式创新提高了交易效率,由互联网驱动的C2B运作模式进一步促进效率提升,在网民规模跳跃式扩张背景下,使得经济的整体交易规模不断膨胀,为深度理解经济运行机理提供了素材。
从产业结构看,信息技术革命推动产业结构优化升级,加速产业间交叉融合,互联网与实体经济之间的化学融合进一步提升了产业边界的模糊化程度,显著改变了中国经济的分类标准及总体构成,造成传统统计框架下的统计漏出问题,存在对经济发展的低估现象。
进一步完善经济统计体系
进一步完善国家的经济统计体系,需要打破传统统计中的行业划分标准及以调研为主的结构化数据制约,广泛应用新技术手段,实现结构化与非结构化数据的有效对接,准确刻画电子商务经济向传统经济逐步渗透直至融合的进程,反映经济的综合发展态势,充分发挥统计工作的应有作用,并最终落脚于电子商务发展对整体经济发展的作用测度,为经济转型升级程度提供量化依据。具体来说需要关注以下几点:
第一,转变基于三产的传统统计观念以适应产业间的化学融合。互联网技术的普及及大数据、云计算等新兴技术的出现,电子商务经济向传统经济的逐步渗透等,均促使行业边界模糊化,改变了传统统计体系依据行业分类来统计经济发展的思路,需要加以完善避免低估经济规模。
第二,综合使用相对指标和绝对指标表征经济规模。国内外有很多机构通过构建相关指数来衡量经济活动中的单一层面,且各指数相对独立,指数间的关系并不明确,需要研究制定能全面表征互联网发展状况的指标体系,构造新的绝对指标直观反映互联网向传统经济的渗透程度。
第三,基于“总量+分布”的理念充分挖掘统计指标信息,实现数据端的价值和意义。相对于传统数据分析,大数据的一个代表性应用便是做关联性分析,在关注总量的同时更应注重空间分布的合理性,在“总量+分布”的核心理念下,研究经济核算技术,形成有价值、高质量的数据集。
第四,构造代表经济发展状况的统计指标体系。结合现有数据的分布特征及数据处理技术,对图像、音频等高维数据进行降维,从大量动态模糊的数据中导出可读数据,提炼出准确反映电子商务经济发展水平的标志性内容,形成学界、业界普遍认可的统计指标,全面反映经济发展现状。
第五,建立数据共享机制,打破数字鸿沟。这就需要权威机构对数据资源实施统一监管。
(作者单位:中央财经大学统计与数学学院,本文受国家社科基金重大项目[15ZDC024]资助和中央财经大学博士重点选题支持)