朱开昊,徐宇凡,吕杨辉,肖 文,王 励
(浙江嘉兴数字城市实验室有限公司,浙江 嘉兴 314000)
自从党的十九大提出推动大数据与实体经济深度融合以来,数据要素价值日益凸显,尤其在医疗教育、社会治理、疫情防控、安全生产等领域,数据更是发挥其巨大效能。深入挖掘数据要素价值已经成为社会共识,相关政策和立法已经逐步为数据要素市场发展打牢基础。
2020年4月,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》(以下简称为《意见》),将数据与土地、劳动力、资本、技术并列为关键生产要素,并提出加快培育数据要素市场。与此同时,《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》三大法律陆续出台,明确数据定义,规范网络数据处理活动,保护个人、组织在网络空间的合法权益,构筑了数据要素市场发展法律边界。为贯彻落实《意见》等文件精神,各地政府积极探索数据要素市场化配置改革,奋力打造数据赋能场景,加快释放数据要素价值。但是,当前我国数据要素市场体系亟须健全完善,如数据统筹力度弱、创新资源配置难等问题阻碍了数据价值的充分释放。因此在推动数据要素市场化配置的过程中,如何高效整合资源、创新资源应用以充分发挥数据要素价值成为当前研究的热门话题。
当前,国内80%可利用、可开发、有价值的数据资源在政府手中[1],充分研究政府公共数据平台数据,创新开发未来数字化应用场景,促进政府公共数据资源向社会开放,对于充分发挥数据要素价值具有重要意义。因此,本文依托城市公共数据平台[2],以个人数据作为切入口,挖掘与梳理个人全量数据资源,建立城市级个人全量信息画像,开展个人画像应用研究。
1.1 个人画像的定义与属性
交互设计之父Alan Cooper最早提出用户画像的概念,定义为真实用户的虚拟代表,是建立在一系列真实数据之上的目标用户模型[3]。用户画像依托特定系统形成个人标签,被普遍应用于商业决策分析,其侧重于用户基本信息与用户行为分析的研究,充分挖掘数据内在价值为管理层提供决策指导,以提高公司的经济效益。
目前,大多数用户画像研究会根据用户属性分为静态属性和动态属性[4-5]。静态属性的信息是用户画像建立的基础,一般指的是用户基本个人信息和其他相对稳定的信息;
动态属性信息指的是用户在使用特定系统时产生的行为信息,此类信息具有实时性和易于变化的特点[5]。
区别于用户画像,本文所定义的个人画像,即个人信息的具体化和标签化,本质上是脱离特定系统描述个人全量信息,构建个人画像。本文将个人画像属性划分为三类:基本属性、关系属性和特定属性。基本属性是指个人的自然属性,具有稳定性、直观性的特点[6]。关系属性是指在一定时间与空间下,人与人或人与物之间的交互产生了关联信息(如家庭信息、车辆信息等)。特定属性指个人在具体应用场景下产生的个人属性信息(如医保信息、用电信息等)。
图1 个人画像总体架构
1.2 个人画像构建
个人画像构建本质上是对个人数据进行收集、挖掘和画像展示[7]。
数据收集是建立个人画像的根基,主要方法有生物识别信息采集法、电子信息收集法等。生物识别信息采集法,通过特定的仪器采集指纹、虹膜、人脸等信息。电子信息收集法,通过电子媒介收集结构化信息,以及尚未进行结构化处理的互联网用户行为信息。
数据挖掘是对已收集的个人信息进行建模与挖掘。该阶段常用到数理统计、在线分析处理、机器学习、情报检索等方法[8]。陆敬筠等[9]通过数理统计、K-means算法等方法,根据上海市公共数据开放平台功能使用的用户浏览数据,通过建模区分不同用户群体。
画像展示是通过数据挖掘构建画像并通过自定义图像化方式进行展示。目前主要的方法有标签云、数理统计图表等。陆敬筠等[9]人利用柱状图、饼图、检索关键词的标签云形式展现以用户应用注册情况、检索行为偏好等为基础构建的用户画像。
1.3 个人画像应用
本文所研究的个人画像主要针对公共事务领域应用[10-12]。研究表明,通过在线健康社区个人画像区分患者、疑似患者、医师、奉献者和社区管理员5类的社会群体,可以提高对疑似患者和奉献者的疫情风险实时监控能力[10]。通过高校学生在校表现和互联网金融分析构建个人信用画像,辅助教育工作者指导高校学生的日常行为[11]。利用基于大学毕业生基本信息、学校管理数据等构建成的毕业生个人画像,为毕业生精准推送岗位信息,可以实现“人职匹配”[12]。
2.1 总体架构
基于个人需求场景,汇聚各政府部门与社会的个人数据并进行数据分类与治理,形成个人画像专题库。基于“数据不动程序动,数据可用不可见”理念,在沙箱环境开发个人数据应用,建立城市级个人全量信息画像平台,依托平台探索数字化应用场景,打造具有特色的个人数据产品(见图1)。
2.2 个人画像构建
以长三角地区XX市为例,依托城市公共数据平台,对全市38个政府机构、13个党委机构、8个县(市、区)的公共数据资源进行全面梳理,共编目1 639张信息资源,40 293个字段,形成公共数据资源目录。
基于该目录,本文从中抽取与人相关的信息要素,筛选出数据资源目录443张,涉及字段7 889个。通过数据分类与治理,建立城市级个人全量信息画像,从中分析出与人相关的标签56个,与人相关的信息有7种类型,为后续与人相关的公共数据治理、个人数据服务、多跨业务创新等提供指导。
2.2.1 个人标签
通过初步梳理,筛选出与人相关的标签56个,分别为残疾人、信访人群、重点车辆人群、法定代表人、司机、强制执行人、行政处罚人员、低收入人群、低保人群、失信被执行人、最低生活保障、黑名单人员、学生、老人、重点青少年、儿童、重点关注人群、网格员等。
2.2.2 与人相关信息类别
本研究围绕基本属性、关系属性和特定属性对个人数据进行整合与分类,梳理出与人相关的7大类别,建立城市级个人全量信息画像(见表1)。
表1 个人信息类别
基于城市级个人全量信息画像,本文从政府、个人、企业层面出发,探索数字化应用场景。
3.1 政府层面
3.1.1 数据治理考核
因历史原因,政府部门被数据质量问题困扰已久,一般会采用普查等传统方法来提高个人数据质量,这不仅存在投入成本高、工作效率低、数据质量难提高等问题,而且不能从根源真正解决个人数据质量问题。
因此,本文提出了政府自主发现个人数据问题并由政府纠错与个人自主上报个人数据问题并由政府纠错双循环的方法。依托城市级个人全量信息画像平台,让用户在应用场景驱动下实现信息便捷查询与数据纠错功能。用户一旦发现个人数据问题,通过平台应用提交数据纠错申请同时附上证明材料,工作人员将在工作日内完成审批,并根据审批结果完成个人数据纠错。这极大提高数据质量以及减轻政府部门数据治理负担,真正从源头解决个人数据质量问题。
3.1.2 社会治理服务
政府人员在社会治理过程中往往会凭借工作经验构建人群画像,并指导工作的开展,但往往会导致实际工作开展成效表现不佳。究其原因,该方式对人群画像的构建具有片面性,无法实现社会治理精准化思维。
因此,构建城市级个人全量信息画像平台来协助政府人员社会精准治理具有重要意义。根据平台提供个人全量标签,辅助政府人员对社会不同人群进行分析与研判,从而减少社会治理成本,增强社会治理成效,保证社会稳定与安全。
3.2 个人层面
3.2.1 业务便捷办理
在政务服务、银行贷款、医院就医等各大业务场景下,个人为了完成身份信息核验常常会遇到出示纸质材料多、办理时间长、业务跨部门办理等问题,给个人业务办理造成极大不便。
城市级个人全量信息画像平台拥有个人全量数据,个人在办理业务时,利用平台将个人相关数据授权给办理业务人员,即可完成个人业务便捷办理,大大简化材料和流程,切实提升个人办理效率,真正实现让数据多跑路,让个人办理少跑腿,加快推进“最多跑一次”改革进程。
3.2.2 个人补贴政策
个人在满足补贴政策申报条件下可以享受到一定的补贴政策福利,但由于个人补贴政策存在时效性低、公布渠道分散、推广力度较低、解读较为复杂,使得个人难以及时获取到当前满足申报条件的个人政策补贴事项。
依托城市级个人全量信息画像平台,实现个人自主了解政策补贴到政策补贴自主推送至个人的转变,帮助个人及时获取满足申报条件的个人政策补贴事项。
3.3 企业层面
3.3.1 个人服务场景打造
当前个人应用服务场景众多,且大多分布在各个企业侧服务平台,没有形成统一集成的平台服务于个人;
同时,服务场景应用存在同质化现象,未根据当地特点深入挖掘形成具有本地特色的应用。
因此,结合本地化特色,整合现有应用便民服务场景,联合核心企业打造未来数字化场景,统一汇聚在城市级个人全量信息画像平台供个人使用,让个人实时享受生活便捷与福利,与企业一同切实优化社会秩序。例如,考虑与本地旅游公司联合打造旅游出行服务场景,个人只须打开该应用即可获取景区信息、旅游方案推荐等,为个人旅游规划做出辅助决策;
与本地银行联合打造业务办理服务场景,让群众知晓每家银行工作时间、业务办理人数、等待时长等信息,协助用户合理规划业务办理。
3.3.2 个人数据流通服务
当前,各个国家或者地方法律条例的颁布保护了个人数据权益,加强了企业对于个人数据开发与使用的合法合规,但在促进个人数据流通方面仍存在较大提升空间。
为了促进个人数据流通,保证数据安全前提下,针对企业真实的便民服务场景,城市级个人全量信息画像平台为企业提供基于个人授权的数据结果。企业按照平台要求申请购买所需的个人数据并提交相关资料;
平台根据场景的合规性审核企业申请的数据;
审核通过后,企业需要与平台签订合约;
依据合约内容,企业通过银行完成交付与结算,并生成数据交易凭证;
平台根据双方签订的合约与数据交易凭证给企业提供基于个人授权的数据结果。
本文以长三角地区XX市为例,基于城市公共数据平台,梳理全市个人公共数据资源清单,建立城市级个人全量信息画像,以数据安全与数据隐私保护为前提,统一监管与规范个人数据,围绕政府层面、个人层面、企业层面,探索个人数据数字化应用,为政府提供具有完整性、准确性的全市个人数据画像,为个人打造便民服务场景与惠民服务政策,为企业提供规范合理的个人数据使用渠道。
为了实现数字化应用,拓展个人数据赋能场景,释放个人数据价值,本文遵循“数据不动程序动,数据可用不可见”的理念,探索个人数据授权运营应用场景,促进个人数据向个人开放,让用户知晓个人数据资产,管理好、使用好个人数据,享受数字化时代带来的便利。
猜你喜欢公共数据全量画像公共数据授权运营机制探索网络安全与数据管理(2022年7期)2022-08-23威猛的画像小哥白尼(神奇星球)(2022年3期)2022-06-06论公共数据管控权的规范建构商丘师范学院学报(2022年7期)2022-03-18成都市温江区全力推进医保全量数据采集试点工作四川劳动保障(2021年7期)2021-12-02公共数据归属政府的合理性及法律意义河南财经政法大学学报(2021年1期)2021-11-26“00后”画像新世纪智能(高一语文)(2020年9期)2021-01-04画像非公有制企业党建(2020年10期)2020-10-27公共数据开放许可的规范建构河南牧业经济学院学报(2020年3期)2020-01-16土壤重金属污染调查与评估的误区及其改进方法环境科学导刊(2016年4期)2016-06-30麦秸全量还田下氮肥运筹对水稻产量及其产量构成的影响上海农业学报(2016年5期)2016-02-10