大型银行全行级数据平台夯实数据基础支撑能力
某国有银行C以全行IT规划为指引,以支撑全行业务发展为主线,夯实管理基础增强支撑能力,优化工程实施模式提高建设能力,为打造一流大型零售商业银行作出新贡献。为实现上述目标,需加快大数据基础环境建设,完善数据治理机制,提高数据产品的开发和交付能力,全面迈入大数据3.0新阶段。
大数据平台仓库一方面着眼未来的应用需求,一方面对现有的技术精细化使用,不断完善和改进数据质量,为管理层提供有力的经营决策支持,实现数据易于使用的目标。
通过系统建设,构建了一套完善的、科学的能够应对多个业务领域的数据模型,建立面向全行应用的企业级数据仓库,同时基于各业务部门数据应用的实际,建设统一数据门户,支撑银行未来数年经营管理、风险管控、市场营销及数据分析的诉求。
项目采用源启数据资产管理平台的一体化开发模块和多个功能组件,内嵌企业级数据模型和完善的指标体系,能够帮助企业快速建成数据仓库平台和支持业务的指标体系。源启数据资产管理平台的数据服务模块,可以帮助企业搭建统一的数据访问门户,提供多层次的数据访问体系,满足各类数据服务需求。
大数据平台仓库系统整合层、基础层均以金融领域十大主题模型为蓝本,结合银行数据特点进行范式定制化开发建设,形成“逻辑模型+物理模型”双体系范式设计模型架构。在逻辑数据模型方面,对主实体模型进行拆分,依据数据量、使用频度、数据更新频度等指标进行拆分,采用双实体模式进行逻辑模型设计,既满足逻辑模型的规范性,又能满足银行的大批量数据的时效性。在物理模型方面,依据数据量大小、批量处理时长等指标进行物理分表和模型预处理工作,提升数据处理效率和时效性。
大数据平台仓库系统共性加工层以协议、客户、渠道、机构、产品五个维度对全行基础指标进行统一加工计算、统一业务口径,提供统一数据服务。同样业务含义的数据指标,共性加工层落地时用统一并唯一的口径进行加工,并将加工口径和指标名称统一纳入数据标准范围内,进行全行发布。
大数据平台仓库系统在数据映射过程中,对标全行已发布数据标准进行数据码值、对字段名称进行落标、对不同源系统的相同码值进行整合,减少数据冗余性,提升数据使用效率与体验;并对数据质量差、空值率高、含义不明确等字段进行屏蔽,反馈,提升下游使用数据质量。
采用开源框架,创新可视化组件,构建适合于银行的数据可视化开发框架和规范,将原有开发框架中地图元素进行创新,增加了客户迁徙轨迹的可视化展示,并利用图论、时间序列、随机森林、文本挖掘等多种模型研发数据产品。
利用图论、时间序列、随机森林、文本挖掘等多种模型研发数据产品。
质量效益优:大数据系统上线以来,为C银行总行多个应用系统及分析项目建设提供数据支撑。集群服务器100+个节点,服务器数据存储1P+的情况下,日处理任务超过10000+个;在满足下游数据时效性的情况下,年度系统可用率应达到99.97%;支持了包括监管报送、数据中台、八大数据集市、门户、管理驾驶舱等50多个下游应用。
降本增效明显:仓库共性加工层从业务分析的视角组织数据,由于数据与统计口径的共享,可减少相同的业务统计所带来的数据重复计算与存储,有效降低数据指标加工的成本。
服务应用友好交互:实现可视化交互式体验的数据产品展示模式、实现数据产品的快速实施与统一管理、通过更为直观展示的结果展示,为用户实现业务意图提供参考和支撑、实现以数据产品的实际需求为目标导向的可视化展示等功能。
赋能业务经营分析大数据门户应用系统上线以来,服务于行内多家一级分行及总行的多个业务部门。该系统构建的多款数据产品为全行业务发展、经营管理、精准营销、风险防控等提供了有力地支撑。
-
源启数据资产平台
集数据管控平台、数据中台和数据工具产品为一体的数据智能底座,提升数据治理水平,释放数据资产价值。
体验产品 -
大数据平台/数据湖
解决数据中台底层数据的一体化采集、管理及消费管理,实现贴源数据的自动化入湖及管理
体验产品 -
源启数据服务平台
统一的数据服务出口,实现了数据的统一市场化管理,有效降低了数据开放的门槛,并保障了数据开放的安全。
体验产品 -
指标管理平台
以“出发于业务、服务于业务”为目标,构建供业务和科技共同和重复使用的指标数据标准体系
体验产品 -
实时数仓开发平台
快速实现数据流批一体处理能力,提供高可靠、低延时数据服务
体验产品 -
外部数据管理平台
提供安全、便捷、统一的外部数据服务,构建可支撑风控、获客、营销等场景的数据模型,强化业务联动的同时持续推进银行数字化建设的进程
体验产品 -
数据中台
实现数据高度整合、数据能力复用,从夯平台、治数据、建服务、触场景四大方向,实现数据服务化
体验产品