ig281 发表于 2025-5-2 06:06:29

中国人民银行征信管理局局长谈大数据在征信体系的贡献与风险平衡

中国人民银行征信管理局局长 万存知

互联网在美国诞生,然而在中国应用得最为广泛。金融科技由互联网衍生而来,处于最前沿位置的依旧是美国和中国。金融科技涵盖大数据、云计算、区块链、人工智能等技术,其中大数据是所有技术运转的最基础单元,还是所有技术发展的“燃料”与“能源”。大数据的创新和发展对征信体系建设有着重要贡献,不过也产生了一些新的风险与矛盾。对于此,我们要把握好大数据发展与风险防范的平衡,引导大数据在征信业务中合规运用,发挥征信作为金融重要基础设施的作用,从而更好地实现建立覆盖全社会征信系统的总体目标。

大数据的基本概念

大数据指的是数量呈指数增长的数据,种类呈指数增长的数据,更新速率呈指数增长的数据,以及处理这些新型数据的处理技术,大数据的产生与发展应用了先进的数据分析手段,其出现重新定义了大量以前难以定义和使用的数据,拓展了数据的应用范围,让数据的使用更加灵活和深入,使数据之间的联系也更为紧密。

大数据包含结构化数据与非结构化数据。结构化数据,也叫行数据。它是指那种通过关系型数据库来进行储存以及管理的数据。这种数据是由二维表结构来进行逻辑表达与实现的。通常会以数字、字母、文字等字符展现出来。它具有一定的规律性。并且数据格式和内容有着严格的限制。非结构化数据是指数据不规则,数据不完整,没有预先定义的数据模型,没有按照预先定义的方式组织的信息,例如电子邮件,例如文本文件,例如音频文件,例如图片和视频,例如图片,例如短信,以及潜在未定义的数据来源。

大数据具有4V的特征:数据量巨大,也就是大量;数据种类繁多,也就是多样;数据处理速度快,也就是高速;数据被赋予了更高的价值,也就是价值(Value)。

大数据在征信体系建设中的应用

大数据具有独特的4V特征,它在促进征信体系建设方面发挥了积极作用。

大数据使数据量级呈指数增长。有一个常被引用的估算。2011年时。全球数据规模是1.8ZB。且以每天至少产生2.5EB数据量的速度在增长。预计到2020年。将会创造出40ZB的数据量 。在国内数据市场里,淘宝每天有上千万家商户持续产生信息,微信月活跃用户超10亿,京东金融每天产生的数据量超200TB,这些都说明大量数据正在产生和积累,并且数据量正迅速增长,这种增长在征信系统中表现得极为明显。

我国已经建成了金融信用信息基础数据库,下称“数据库”,该数据库收录人数最多,数据规模最大,覆盖范围最广。截至2018年9月末,人民银行运维的数据库中,个人系统累计收录信贷信息30亿多条,个人系统累计收录非信贷信息66亿多条,个人系统为9.7亿多自然人建立统一的信用档案,个人系统接入法人机构3453家,个人系统日均查询477万余次;企业系统累计收录信贷信息3.5亿多条,企业系统累计收录非信贷信息5100多万条,企业系统为2560多万户企业和其他组织建立了信用档案,企业系统接入法人机构3351家,企业系统日均查询29万余次。

https://img1.baidu.com/it/u=2152153485,3838986141&fm=253&fmt=JPEG&app=138&f=JPEG?w=888&h=500

大数据丰富了信息类别,让信息来源愈发广泛,其发展促使多种替代数据在信贷领域出现,替代数据涵盖个人支付、交易、消费、社交、上网痕迹、网络搜索、生活轨迹等,来源从传统金融机构拓展到政府部门、公共事业单位、互联网公司、科技公司等,现已被广泛应用于信贷支持 。

从国外发展情况来看,国外征信机构广泛探索利用替代数据来支持信贷,比如采集电信账单支付数据,采集有线电视账单支付数据,采集租赁账单支付数据,采集移动设备网络数据,采集电子邮件网络数据,采集社交媒体网络数据,采集社会关系信息,以此对无信用记录者提供征信服务,对薄信用记录者也提供征信服务。

从国内发展方面来看,国内征信机构加大了对替代数据的采集力度。当前,数据库实现了对银、证、保领域借贷信息的共享,还采集了社保、公积金、环保、欠税、民事裁决与执行等替代数据。此外,百行征信依照“共商、共建、共享、共赢”原则,已和241家机构签订信用信息共享合作协议,这些机构包括网络借贷信息中介机构(P to P)、网络小额贷款公司、消费金融公司、汽车金融公司、融资租赁公司、民营银行、助贷机构、金融科技公司等,并且会逐步覆盖到水电气话等公用单位以及运营商所掌握的、能对个人信用状况产生影响的替代数据。

大数据加快了信息集中的速度,缩短了信息流动所需的时间。大数据的高速特性在更大程度上让征信功能得以发挥作用。数据的产生速度越快,数据的流动速度越快,数据的集中度就越高,征信系统就能迅速甚至实时地对客户偿债意愿和偿债能力作出判断,在确保信息时效性、提高信贷效率的同时,还能更好地防范金融领域中的各类风险。

高速的数据输入速度,高速的数据处理速度,高速的数据输出速度,使得征信机构的数据更新与交互时间发生了变化,从原本的1月、1周、1天,变为了1小时、1分钟乃至实时。当前数据库已经支持实时更新,能够实时对客户做出分析评价,还能及时完成大量的异议及各类数据的更正,以此保证征信系统高速高质量运转。此外,征信机构与银行开展了数据实时传输与更新,这一过程是7×24不间断的,既确保了数据时效性,又大大缩短了放贷时间,在线上,企业从贷款申请到发放贷款的时间,由传统的10天左右被压缩至10分钟左右,拉近了征信机构、放贷人和借贷人之间的距离。

大数据挖掘出了数据的深层内涵与关系,从而为数据创造了新价值,大数据和新型数据处理技术能深入挖掘已有数据价值,能提高以前低价值数据的价值,还可通过发掘数据内在联系赋予数据新价值。

在征信系统建设里,征信机构挖掘信贷信息和替代数据的价值,借此提供征信增值产品与服务,从多个维度评价客户信用状况,为没有信用记录的客户给予信用评价,助其获取正规金融服务,提高贷款可获得性。征信机构挖掘数据价值的模式主要有以下三种。

首先是进行横向的关联数据采集,通过广泛收集政府部门以及公用事业单位所掌握的各类信息,包括企业工商登记信息、纳税信息、财务报表信息、社保公积金缴纳信息、水电气缴费信息、知识产权信息等,接着对这些信息的内在关联展开分析研究,最后提供征信服务。

二是在纵向方向上,垂直整合信息资源。比如,对供应链上下游企业之间的应收应付信息进行整合,对这些信息进行确权。以供应链金融作为载体,建立供应链上大型企业和中小微企业间的信用传导机制,从而开拓出征信业务新模式。

三是深入挖掘数据内涵,通过深入挖掘税务信息价值,与商业银行合作开发基于税务数据的深度征信产品,提供更具针对性的征信服务。

征信机构借助这三种征信业务模式,根据当地实际情况开展征信服务,为银行和企业搭建沟通桥梁,增进双方信任,解决了小微企业首次申请贷款时面临的门槛问题,对化解小微企业融资困难、融资成本高的状况具有积极作用。

此外,通过大数据挖掘负面信息,能够起到防范欺诈风险的作用,还能起到降低信贷风险的作用。

大数据存在的问题

https://img2.baidu.com/it/u=3262316226,668424755&fm=253&fmt=JPEG&app=120&f=JPEG?w=1108&h=500

我国现有法律对大数据行业没有明确定义,对使用大数据的机构没有明确规范和管理方式,这容易导致大数据行业因缺乏监管出现违法采集、过度采集、滥用个人信息和商业机密的问题,使得个人隐私和商业秘密得不到有效保护,还不利于大数据行业健康有序发展 。

数据安全问题频繁发生,数据跨境监管存在困难。当下,因外部黑客入侵,因内部员工监守自盗,因机构信息管理不健全等缘故,数据行业信息泄露事件屡屡出现,互联网公司Face-book、征信机构的信息泄露事件在全球都造成了极大的负面影响 。信息技术高速发展,互联网快速普及,大数据爆发式增长,这在为个人提供极大便利的同时,也让信息安全保护面临严峻挑战,信息安全是国家安全战略的重要组成部分,征信行业拥有大量敏感度高、私密性强的个人信用信息,它是国家的关键数据资源,一旦发生信息泄露,就会造成非常严重的后果 。

大数据行业快速发展,使得数据跨境监管难度上升,国家安全数据、个人隐私、商业秘密数据的跨境安全难以保障,欧盟的GDPR、美国和欧盟之间的隐私盾协议对数据跨境有相应规定,我国对数据跨境流动暂未作相关规定。

数据来源难以清晰,难以准确,难以做到可控。大数据应用于征信时,面临数据来源良莠不齐的问题,面临数据不完整的问题,面临质量没保障的问题,数据准确性难以得到保证,数据及时性难以得到保证,数据完整性难以得到保证 。数据量庞大,数据源单位存在安全管控限制,致使数据大多源于网络爬取,缺乏固定数据合作关系,数据呈碎片状,没有使用规则,数据的准确性、完整性、系统性及稳定性欠佳,标准化和格式化水平低,非格式化数据随机性强,因此大数据“垃圾进、垃圾出”的说法颇为流行,产品与服务的公正性也无法得到保证。

大数据行业的市场共享机制还没有成型,目前大数据行业没有形成统一的数据处理与分享规则,掌握数据的机构数量众多,各有各的数据来源,在缺少统一标准化的专业术语、技术标准以及行为规范的状况下,实际上形成了一个个信息孤岛,这不利于实现信息全覆盖市场格局的形成,更不利于大数据市场统一秩序的形成。

下一步工作思考

大数据是一把双刃剑,其优势和劣势都极为明显,需一分为二地看待,既要发挥大数据在促进经济金融活动更快更有效运转方面的优势,又要解决好大数据在个人隐私、信息安全等方面的劣势。发展大数据产业,重点在于将大数据产业纳入监管范畴,如此才能更好发挥大数据促进征信系统建设的作用。

尊重信息主体权益和信息安全是大数据自由流动的前提。要平衡商业化应用所需的数据自由流动与信息主体权益保护之间的关系,协调信息提供方、信息采集加工方(如征信机构等)、信息使用方等各方的利益诉求,确保信息主体权益得到尊重和维护,探索通过一种无差异自愿的合作机制,将各方有机联结起来,形成稳定的良性互动的路线图,建立健全信息共享的体制机制。

积极参与个人数据保护、数据跨境流动、数据网络安全等法律法规以及国际标准的制定工作,加强征信体系建设里的信息保护制度建设,强化信息安全保护能力,提高信息安全管理水平,建立并完善数据泄露通知制度以及应急补救预案,达成数据来源清晰、准确且可控的目标,确保数据在安全、合规的条件下自由流动。

继续发挥大数据在征信体系建设里的优势,助力普惠金融,解决小微企业融资难、融资贵等问题。大数据具备4V特征,它能帮助解决传统征信解决不了的问题,能渗透到传统征信渗透不到的地方。因此,要发挥征信的作用,将征信机构作为数据传递的纽带,借助大数据拓宽信息来源以及征信产品的应用,多维度展示个人和小微企业的信用及风险状况,如此才能更好地帮助缺少信用记录的个人和小微企业获取贷款,进而推动普惠金融的发展,解决小微企业融资难、融资贵的问题,最终实现信用信息的全生命周期全覆盖。

往期精选

(点击图片查看精彩内容)

《金融电子化》《金融安防》订阅方法:
页: [1]
查看完整版本: 中国人民银行征信管理局局长谈大数据在征信体系的贡献与风险平衡