数据管理能力成熟度评价模型(GB/T36073-2018, DCMM)作为我国首个数据管理领域国家标准,将组织内部数据能力划分为数据战略、数据治理、数据架构、数据标准、数据质量、数据安全、数据应用、数据生存周期8大能力域及28个能力项。
数据质量
数据质量是指在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。该能力域下有4个能力项:数据质量需求、数据质量检查、数据质量分析、数据质量提升。
一、数据质量需求
数据质量需求明确数据质量目标,根据业务需求及数据要求制定用来衡量数据质量的规则,包括衡量数据质量的技术指标、业务指标以及相应的校验规则与方法。
数据质量需求是度量和管理数据质量的依据,需要依据组织的数据管理目标、业务管理的需求和行业的监管需求并参考相关标准来统一制定、管理。
1.1 过程描述
a) 定义数据质量管理目标,依据组织管理的需求,参考外部监管的要求,明确组织数据质量管理目标;
b) 定义数据质量评价维度,依据组织数据质量管理的目标,制定组织数据质量评估维度,指导数据质量评价工作的开展;
c) 明确数据质量管理范围,依据组织业务发展的需求以及常见数据问题的分析,明确组织数据质量管理的范围,梳理各类数据的优先级以及质量需求;
d) 设计数据质量规则,依据组织的数据质量管理需求及目标,识别数据质量特性,定义各类数据的质量评价指标、校验规则与方法,并根据业务发展需求及数据质量检查分析结果对数据质量规则进行持续维护与更新。
1.2 过程目标
a) 形成明确的数据质量管理目标;
b) 明确各类数据质量管理需求;
c) 建立持续更新的数据质量规则库。
1.3 能力等级标准
第1级:初始级
在项目中分析了数据质量的管理需求,并进行了相关的管理。
第2级:受管理级
1) 制定数据质量需求相关模板,明确相关管理规范;
2) 在组织或业务部门识别了关键数据的质量需求;
3) 设计满足本业务部门需求的数据质量评价指标,并建立了数据质量规则库。
第3级:稳健级
1) 明确组织层面的数据质量目标,统一数据质量需求相关模板、管理机制;
2) 建立数据认责机制,明确各类数据管理人员以及相关职责,制定各类数据的优先级和质量管理需求;
3) 数据质量目标的制定考虑了外部监管、合规方面的要求;
4) 设计组织统一的数据质量评价体系以及相应的规则库;
5) 明确新建项目中数据质量需求的管理制度,统一管理权限。
第4级:量化管理级
1) 数据质量需求能满足业务管理的需要,融入数据生存周期管理的各个阶段;
2) 数据质量评价指标体系的制定参考了国家、行业相关标准;
3) 量化衡量数据质量规则库运行的有效性,持续改善优化数据质量规则库。
第5级:优化级
在业界分享最佳实践,成为行业标杆。
二、数据质量检查
数据质量检查根据数据质量规则中的有关技术指标和业务指标、校验规则与方法对组织的数据质量情况进行实时监控,从而发现数据质量问题,并向数据管理人员进行反馈。
2.1 过程描述
a) 制定数据质量检查计划,根据组织数据质量管理目标的需要,制定统一的数据质量检查计划;
b) 数据质量情况剖析,首先根据计划对系统中的数据进行剖析,查看数据的值域分布、填充率、规范性等,切实掌握数据质量实际情况;
c) 数据质量校验,依据预先配置的规则、算法,对系统中的数据进行校验;
d) 数据质量问题管理,包括问题记录、问题查询、问题分发和问题跟踪。
2.2 过程目标
a) 制定数据质量检查计划;
b) 全面监控组织数据质量情况;
c) 建立数据质量问题管理机制。
2.3 能力等级标准
第1级:初始级
基于出现的数据问题,开展数据质量检查工作。
第2级:受管理级
1) 定义了数据质量检查方面的管理制度和流程,明确数据质量检查的主要内容和方式;
2) 业务部门根据需要进行数据质量剖析和校验;
3) 在各新建项目的设计和实施过程中参考了数据质量规则的要求。
第3级:稳健级
1) 明确组织级统一的数据质量检查制度、流程和工具,定义了相关人员的职责;
2) 根据组织内外部的需要,制定了组织级的数据质量检查计划;
3) 在组织层面统一开展数据质量的校验,帮助数据管理人员及时发现各自的数据质量问题;
4) 在组织层面建立数据质量问题发现、告警机制,明确数据质量责任人员;
5) 建立了数据质量相关考核制度,明确了数据质量责任人员考核的范围和目标;
6) 明确新建项目各个阶段数据质量的检查点、检查模板,强化新建项目数据质量检查的管理。
第4级:量化管理级
1) 定义并应用量化指标,对数据质量检查和问题处理过程进行有效分析,可及时对相关制度和流程进行优化;
2) 数据质量管理纳入业务人员日常管理工作中,可主动发现并解决相关问题。
第5级:优化级
在业界分享最佳实践,成为行业标杆。
三、数据质量分析
数据质量分析是对数据质量检查过程中发现的数据质量问题及相关信息进行分析,找出影响数据质量的原因,并定义数据质量问题的优先级,作为数据质量提升的参考依据。
3.1 过程描述
a) 数据质量分析方法和要求,整理组织数据质量分析的常用方法,明确数据质量分析的要求;
b) 数据质量问题分析,深入分析数据质量问题产生的根本原因,为数据质量提升提供参考;
c) 数据质量问题影响分析,根据数据质量问题的描述以及数据价值链的分析,评估数据质量对于组织业务开展、应用系统运行等方面的影响,形成数据质量问题影响分析报告;
d) 数据质量分析报告,包括对数据质量检查、分析等过程累积的各种信息进行汇总、梳理、统计和分析;
e) 建立数据质量知识库,收集各类数据质量案例、经验和知识,形成组织的数据质量知识库。
3.2 过程目标
a) 建立数据质量问题评估分析方法;
b) 定期分析组织数据质量情况;
c) 建立持续更新的数据质量知识库。
3.3 能力等级标准
第1级:初始级
基于出现的数据质量问题进行分析和评估。
第2级:受管理级
1) 在某些业务部门建立数据质量问题评估分析方法,制定数据质量报告模板;
2) 对数据质量问题进行分析,明确数据质量问题原因和影响;
3) 在某些业务部门建立数据质量报告。
第3级:稳健级
1) 制定组织层面的数据质量问题评估分析方法,制定统一的数据质量报告模板,明确了数据质量问题分析的要求;
2) 制定数据质量问题分析计划,定期进行数据质量问题分析;
3) 对关键数据质量问题的根本原因、影响范围进行分析;
4) 组织定期编制数据质量报告,并发送至利益相关者进行审阅;
5) 建立数据质量分析案例库,提升组织人员对于数据质量的关注度;
6) 对产生的信息进行知识总结,建立数据质量知识库。
第4级:量化管理级
1) 建立数据质量问题的经济效益评估模型,分析数据质量问题的经济影响;
2) 通过数据质量分析报告及时发现潜在的数据质量风险,预防数据质量问题的发生;
3) 持续改善优化数据质量知识库。
第5级:优化级
1) 通过数据质量分析提升员工数据质量的意识,建立良好的数据质量文化;
2) 在业界分享最佳实践,成为行业标杆。
四、数据质量提升
数据质量提升是对数据质量分析的结果,制定、实施数据质量改进方案,包括错误数据更正、业务流程优化、应用系统问题修复等,并制定数据质量问题预防方案,确保数据质量改进的成果得到有效保持。
4.1 过程描述
a) 制定数据质量改进方案,根据数据质量分析的结果,制定数据质量提升方案;
b) 数据质量校正,采用数据标准化、数据清洗、数据转换和数据整合等手段和技术,对不符合质量要求的数据进行处理,并纠正数据质量问题;
c) 数据质量跟踪,记录数据质量事件的评估、初步诊断和后续行动等信息,验证数据质量提升的有效性;
d) 数据质量提升,对业务流程进行优化,对系统问题进行修正,对制度和标准进行完善,防止将来同类问题的发生;
e) 数据质量文化,通过数据质量相关培训、宣贯等活动,持续提升组织数据质量意识,建立良好的数据质量文化。
4.2 过程目标
a) 建立数据质量持续改进策略;
b) 制定数据质量改进方案;
c) 建立良好的数据质量文化。
4.3 能力等级标准
第1级:初始级
对业务部门或应用系统中出现的数据问题进行数据质量校正。
第2级:受管理级
1) 制定数据质量问题提升的管理制度,指导数据质量提升工作;
2) 明确数据质量提升的利益相关者及其职责;
3) 批量进行数据质量问题更正,建立数据质量跟踪记录;
4) 根据数据质量问题的分析,制定并实施数据质量问题预防方案。
第3级:稳健级
1) 建立组织层面的数据质量提升管理制度,明确数据质量提升方案的构成;
2) 结合利益相关者的诉求制定数据质量提升工作计划,并监督执行;
3) 定期开展数据质量提升工作,对重点问题进行汇总分析,制定数据质量提升方案,从业务流程优化、系统改进、制度和标准完善等层面进行提升;
4) 明确数据质量问题责任人,及时处理出现的问题,并提出相关建议;
5) 持续开展培训和宣贯,建立组织数据质量文化氛围。
第4级:量化管理级
1) 组织中的管理人员、技术人员、业务人员能协同推动数据质量提升工作;
2) 能通过量化分析的方式对数据质量提升过程进行评估,并对管理过程和方法进行优化。
第5级:优化级
1) 开展数据质量提升工作,避免相关问题的发生,形成良性循环;
2) 业界分享最佳实践,成为行业标杆。