特步独家打造世运会专属文化名片 展现品牌实力和担当 | 跨入Next Level!SugonRI2.0即将发布 | 零点有数:公共数据要素流通的途径与形态分析 | 更高能更专业,华为全新超能旗舰MateBook GT 14正式发布 | 厦门人簪荷花去哪看?美颜相机“粉荷簪花出片”活动登上热搜 | 多家头部央国企率先启动内部办公应用鸿蒙原生应用开发,引领数字化转型新潮流 | 喜茶参与的新茶饮公益基金一周年 已落实公益资金超2000万元 | 国际大师Diego教授携手术锐单孔机器人引领胸外科手术新变革 | 抖音生活服务「心动风向标」,心动的风吹到了故宫以东 | 东软集团发布TalentBase数智人力资本管理产品 |
 
当前位置: 新闻>滚动>

零点有数:公共数据要素流通的途径与形态分析

发布时间:2024-08-08 15:21:34  |  来源:东方财富网  |  作者:  |  责任编辑:王琦

在数据确权、价格评估机制、流通规则和基础设施建设等相关基础制度和标准规范体系不断健全和完善的过程中,了解公共数据要素流通的各种途径与相应的具体形态将有助于加快推进公共数据要素市场化配置的进程。

01公共数据流通的途径与形态

从公共数据的生产、持有、经营和应用链条来看,公共数据从供给端至需求侧大致包括以下四个途径,不同途径对应不同的数据形态。如附图所示。

附图公共数据流通的途径与形态

途径一:数智应用

原始数据经过数据治理形成高质量的数据集或数据仓库。以数据集或数据仓库为数据对象,通过传统的统计分析方法或机器学习算法,挖掘数据所承载的信息及信息蕴含的知识,将这些信息和知识应用于业务运营过程中的态势感知、风险预判和辅助决策,助力业务运营过程中的提质增效或降本增效。其流通形态为数据视图、数据报表、信息发布或分析报告等数据智能产品。

途径二:数据共享

数据共享是实现数据要素流通、发挥数据要素价值的重要途径之一,是数字政府、数字经济和数字社会建设的重要内容之一,是实现跨区域、跨部门、跨层级、跨业务和跨系统(简称“五跨”)一体协同的重要支撑。因此,建设数据共享平台,建立分类分级数据资源共享机制(如无条件共享、有条件共享、部分共享和不予共享等)是实现数据共享的核心建设内容。其流通形态大多为数据信息字段、数据集或数据文件,也包括运用隐私计算或区块链技术进行计算后的结果数据(如人脸识别应用过程中的结果数据)。

途径三:数据开放

数据开放是在更广的应用场景和应用范围内促进公共数据要素的流通和价值发挥。在确保网络安全、数据安全和隐私保护的前提下,政府向社会免费开放一定范围内的数据查询、数据调用与数据服务,或赋予公众对政府或行业等公共部门运行状况的知情权,或助力数商企业基于公共数据进行产品应用开发,以促进数字政府、数字经济和数字社会共建共享。

途径四:数据交易

数据交易是在数据开放的基础上,针对一定范围内的共享数据,政府向社会提供有偿数据要素服务,即在遵循数据安全法和个人信息保护法的前提下,为社会各行业各企业提供有偿的公共数据服务。数据要素购买方通过买入公共数据要素,或开发用于自身业务运营的数据产品,形成可会计入表的数据资产;或开发用于对外销售的市场应用数据产品,以实现增收创利。数据交易可分场内交易和场外交易。从合规、安全和监管角度来看,场内交易将是主流形式。据统计,截止目前,国内已建立近60个场内交易所。数据交易的数据要素形态包括标准数据集和数据产品,也包括脱敏后的初加工数据资源。从目前来看,数据交易的购买方以金融机构、互联网大厂、头部企业、工业链主和初创公司为主。随着数据交易生态的不断完善和成熟,未来将会有更多的市场主体作为购买方加入数据交易活动中。

02以12345政务热线数据为例的数据要素流通分析

12345政务热线积累了海量群众和企业诉求,因其具备较高的更新时效性(每天有大量数据产生)、数据类型的多样性(既有数值型数据、又有文本型数据;既有客观的时间数据、又有主观的评价数据等)、数据内容的完整性(包括但不限于人员信息、点位信息、事项信息、处办信息等)、所涉事项的广覆盖性(平均每个城市较细颗粒度事项分类在2000项左右,基本涵盖经济、社会、生活的方方面面)等特点,已经成为党委政府了解社情民意发展动态最鲜活的数据源之一。零点有数在全国热线大会上曾提出热线是“天地线”的理念,即热线数据一方面可以辅助决策,是为“天线”;另一方面可以赋能基层治理,是为“地线”,由此可见热线数据的价值所在。

按照前述公共数据流通的四种形态,针对热线数据,在每种形态下可以做如下探索:

途径一:数智应用——以社情民意感知平台为载体,形成内部提质增效产品

在数智应用方面,热线数据的核心价值在于提质增效,尤其是区县级热线部门(主管热线的政府办、数据局或城运中心等),要能从热线数据中挖掘出值得关注的问题点来,通过不断优化行政资源的调度方式,以相对最短时间、最小成本,来落实“接诉即办”“未诉先办”,从而让诉求“办得更实”。

在具体场景方面,可以通过命名实体识别技术、知识图谱技术等抽取不同字段下的不同数据,支撑不同场景的实际应用。

一是在考核场景下,从过程性数据入手,监测处办全流程。将接单、派单、退单、办理、办结、评价等数据字段按照事项、部门进行分类挖掘,找到“不满意影响因素”,再提前消除该因素,提升本区考核成绩。二是在“解决一类事”场景下,关注首发性、苗头性、突增性事项,提前介入,防止事项升级;关注区域性多发事项,防止事项进一步蔓延;关注“多人一诉”“一人多诉”事项,防止群体性事项发生。三是在“未诉先办”场景下,可通过时序预测、规律预判等算法,通过对历史数据的挖掘来预测未来某事项的发生概率,通过消除事项发生的前提条件而防止事项发生。四是在赋能基层场景下,可关注基层治理要点、顽症问题等,赋能基层集中力量解决重要问题。

途径二:数据共享——以“热线+”事项分析平台为载体,形成标准化热线数据集

本质上,热线数据属于“需求侧”数据,与此同时,政府各部门积累了各自主管或监管领域的大量“供给侧”数据(包含政策数据、行政相对人的客观数据等)。当需求侧数据和供给侧数据结合起来时,其体现出来的“供需一致”或“供需错配”的结果就更具价值。因此,可以以热线数据为线索,在具体场景下,调用其他部门的行业数据,形成数据“五跨”共享,赋能其他部门更好发挥数据价值、更深入更直观把握群众和企业需求。

从理论上看,“热线+”可以与任何一个热线承办单位形成数据共享,赋能承办单位更好地了解群众企业诉求、更好地履职。从实践中,可以从如下部门入手,形成该部门的“热线数据集”:

“热线+网格”:将热线数据与网格数据进行汇融,赋能网格人员巡查时关注热线反映较多的问题,通过提前处置,实现“未诉先办”。

“热线+综治”:将热线数据与矛盾调解等数据进行汇融,通过热线数据捕捉社会稳定风险“弱信号”,及早协商解决,防止“小事拖大、大事拖炸”。

“热线+营商环境”:通过与营商、发改、政务服务、金融、人社、经信等部门的数据汇融,协助营商环境建设相关部门更好地打造“为企服务包”。

“热线+人大/政协”:人大代表、政协委员在履职过程中,可以抽取各自领域或界别的热线数据作为调研、撰写提案议案的素材。

“热线+纪检监察”:纪委监委可将热线处办中超期、未办结、不满意、群诉等数据作为检核机关作风和干部作风的线索。

……

随着各部门对热线数据重视程度的提高和使用程度的深入,以部门职责为分类依据的标准化热线数据集将逐渐积累,热线数据的共享程度将逐步提高。

途径三:数据开放——以事项分析平台为载体,按照社会需求方形成热线数据集或热线数据服务

数据开放与数据共享的技术逻辑比较一致,只是面向的对象不同,与政府各部门有相对稳定的职责不同,社会主体因其多样性而导致所需数据产品(数据集或数据服务)也有较大的不确定性。因此“事项分析平台”中的“内置事项”和“自定义事项”就能较好解决这个问题。

内置事项,可以根据前期对数据潜在需求方的调研,形成部分比较固定的数据集,内置到平台中,随时进行数据清洗与治理、数据建模、数据结果输出。比如抽取热线数据中的点位信息及与点位信息相关的一些动态信息(如住房维修情况、小区管理情况、道路交通情况等等),形成比较固定化的数据集,供金融保险机构、建设机构等使用,辅助其做相关营销、产品设计决策。

自定义事项,是指有偶发性需求出现,需要快速进行数据提取、数据治理、建模、结果输出等工作。因此,需要具有较快速的热线数据重新分类能力、较准确的热线数据抽取能力和建模计算能力。事项分析平台通过积累的分类模型、算法模型,可以快速实现此类自定义事项的识别与抽取,节省人工逐条分析工单的时间、精力等成本投入。需求方只需简单点选相关主题内容,即可在安全、合规的前提下,快速形成结果输出。

途径四:数据交易——以多样化数据产品为载体,满足潜在客户的需求

数据交易需要确定购买方及了解清楚购买方的实际需求,为了促成双方交易,数据产品形态需要多样化、灵活化,以满足潜在客户需求。对热线数据而言,综合来看可以通过如下产品形态进行交易:

一是标准化数据集。如前所述,通过抽取出某一领域的数据来,形成N个数据集,供需方购买。

二是订阅式数据服务。因热线数据的实时更新性,需求方可以通过订阅式服务来不断获取新更新的数据。

三是综合式数据报告。因数据集或数据服务形态相对单一,当复杂需求出现时,可通过综合式数据报告的方式,将热线数据、相关其他数据纳入进来,形成综合式数据报告,供需求方购买。

以上,是对热线数据四种流通形态所做的简要分析,从实现逻辑来说,需要经过以下几个步骤:

一是精细化分类。需要按照场景细分的程度,对现有热线分类体系进行更进一步的精细化分类,使新的针对具体场景的分类能符合具体需求。

二是自动分类工单。需要将存量工单和新增工单,按照新的精细化分类体系进行重新分类,通过自动分类算法降低人工投入度。

三是抽取工单要素并构建具体场景下的知识图谱。不同场景的工单文本数据,其所包含的要素是不同的(比如物业管理相关工单包含小区信息,而营商环境工单则包含公司、行业信息,两者逻辑不同),因此需要按照场景需求抽取不同工单要素,构建出该场景下的知识图谱,方便数据需求方在多维度下使用数据。

四是封装成安全、合规的数据产品。根据需求方的不同需求,形成数据集、数据服务、数据报告等不同产品形态。

总体来看,实现公共数据要素流通需要在数据产权、数据流通规则、收益分配机制、安全治理规范等基础制度的基础上,进一步夯实和完善数据共享平台和共享机制、数据开放平台和开放制度、数据质量评价和数据价值评估体系以及合规审计等基础设施和体系建设。在工程技术上,需要分类分级加强公共数据的行业标准、团体标准和治理规范建设,以形成高质量的标准数据集,形成公共数据空间。同时,要加强基于问题场景触发的算法模型库建设,提高对公共数据产品和数据资产的开发效率和开发质量,为公共数据要素的有序自主合规安全流通创造有利条件。