T/CECC 32-2024 数据质量评估实施方法 ,该文件为pdf格式 ,请用户放心下载!
尊敬的用户你们好,你们的支持是我们前进的动力,网站收集的文件并免费分享都是不容易,如果你觉得本站不错的话,可以收藏并分享给你周围的朋友。
如果你觉得网站不错,找不到本网站,可以百度、360搜搜,搜狗, 神马搜索关键词“文档天下”,就可以找到本网站。也可以保存到浏览器书签里。
收费文件即表明收集不易,也是你们支持,信任本网站的理由!真心非常感谢大家一直以来的理解和支持!
G 04
团体标准
T/CECC 32—2024
数据质量评估实施方法
Data quality evaluation——Implementation methods
2024-12-06 发布2024-12-06 实施
中国电子商会发布
目次
前言.............................................................................. II
1 范围................................................................................. 1
2 规范性引用文件....................................................................... 1
3 术语和定义........................................................................... 1
4 评估流程............................................................................. 1
5 判定方法............................................................................. 4
附录A (资料性) 数据质量评估指标参考............................................. 6
参考文献............................................................................ 7
T/CECC 32—2024
II
前言
本文件按照GB/T 1.1—2020 《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
起草。
本文件主要起草人:任贵超、冯立鹦、杨燕、尹路、吴言、杨光、何瑞娟、刘军、姚心、杨永亮、
曹熙、何一峰、王红梅、蔡莉、赵少东、张婷、刘聪、张晋桂、柯尊旺、李娜、韩启龙、郑坚财、单晓
炯、谢靖、林秀峰、左文进、盛晶、张燕、谭文、彭文钦、尚艳学、贾世聪、周万青、张迪、黎名航、
彭伟、陈虹伊、陈自岩、马建智、林松、宋洪涛、闫霜、谭伊舒、骆俊林、罗刚、杨柳、刘巍、李卫、
孙博闻、彭文华、李玮、孙璐、骆伊宁、王春苗、翟红宇、杜晶晶
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。
本文件由中国电子商会数据要素发展工作委员会提出。
本文件由中国电子商会归口。
本文件起草单位:国家工业信息安全发展研究中心、云南省科学技术院、中国移动通信集团辽宁有
限公司、南方电网数字平台科技(广东)有限公司、中国五矿集团有限公司、云上贵州大数据产业发展
有限公司、中国恩菲工程技术有限公司、南方电网大数据服务有限公司、北京易智时代数字科技有限公
司、数字金华技术运营有限公司、云南大学软件学院、深圳供电局有限公司、中译语通科技股份有限公
司、上海罗盘信息科技有限公司、中国电力工程顾问集团西南电力设计院有限公司、北京中数登数据服
务有限公司、广东拓思软件科学园有限公司、新疆大学、宁夏凯信特信息科技有限公司、哈尔滨工程大
学、北京北明数科信息技术有限公司、中数联数据(上海)有限公司、上海宜软检测技术有限公司、昆
仑数智科技有限责任公司、北京科技大学、北京国际大数据交易所有限责任公司、贵阳大数据交易所、
深圳数据交易所、北京信源电子信息技术有限公司大同分公司。
。
T/CECC 32—2024
1
数据质量评估实施方法
1 范围
本文件规定了数据质量评估活动的流程及方法。
本文件适用于评估机构开展的数据质量评估活动。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件。不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
T/CECC 31.1 数据质量评估指标体系第1部分:通用要求
T/CECC 31.2 数据质量评估指标体系第2部分:开放共享要求
T/CECC 31.3 数据质量评估指标体系第3部分:交易要求
3 术语和定义
T/CECC 31.1、T/CECC 31.2、T/CECC 31.3所界定的以及下列术语和定义适用于本文件。
3.1
被评估方organization subject to the appraisal
申请数据质量评估的组织个体。
3.2
评估机构assessment authority
统筹数据质量评估工作的组织个体。
4 评估流程
4.1 概述
数据质量评估流程包括评估前沟通、评估计划制定、评估实施、质量分析以及质量改进环节,如图
1 所示。
T/CECC 32—2024
2
图1 数据质量评估实施流程
4.2 评估准备阶段
4.2.1 受理评估
受理评估申请是评估机构对被评估方提交的数据质量评估申请材料进行审核,确认被评估方符合数
据质量评估条件,条件包括:
a) 被评估方应是在中国境内合法注册成立并运营的组织,其业务活动符合国家相关法律法规和
政策要求;
b) 被评估方应当具备一定的数据管理能力,包括但不限于数据的存储、处理等;
c) 被评估方应具备一定的技术支持能力,向评估机构必要的数据质量评估支持;
d) 被评估方应保持开放和合作的态度,积极配合评估机构的工作。
4.2.2 组建评估组
评估机构根据被评估方提供的数据情况,选派评估人员组建评估组,评估人员应符合相关要求,包
括:
a) 具有经济、统计、计算机相关的工作背景或工作经验;
b) 遵守评估工作要求,掌握评估方法与评估工具的使用;
c) 按照评估计划开展评估活动;
d) 维护数据在评估过程中的保密性与安全性;
e) 能够识别数据质量相关问题;
f) 能够提供数据质量改善建议和策略。
4.2.3 确认评估数据
评估机构应向被评估方明确数据质量评估目的及用途。
评估机构应根据评估目的及用途,明确被评估数据范围,包括但不限于评估数据时间范围、内容范
围等。
评估机构应明确被评估数据的来源及获取方式,确定数据来源的合法性与准确性。
T/CECC 32—2024
3
评估机构应明确数据存储位置及数据读取方式,保证数据在评估过程中的可访问性。
4.2.4 确认评估目的
评估机构应确认数据质量评估目的,深入分析被评估方业务需求,明确业务运行过程中对数据质量
的各项关键要求,包括但不限于数据规范要求、数据完整度要求、数据时效要求、数据准确度要求、数
据共享要求等。
4.2.5 梳理标准法规
数据评估机构应根据被评估数据的内容及用途,明确数据评估工作使用的标准及相关法规。
4.2.6 制定评估计划
评估机构应根据被评估数据内容及数据量,合理分配评估人员及时间,制定合理的评估计划,包括
评估目的、评估范围、评估任务、评估时间、评估人员、评估日程安排、评估所需要场地和设备等内容。
4.3 评估实施阶段
4.3.1 评估方法
评估机构应按照被评估数据的内容与形式,选择适当的数据质量评估方法,包括:
a) 系统评估:使用数据质量管理系统等数据质量工具实现自动化评估,如自定义SQL语句检核、
数据集成工具等;
b) 人工评估:根据评估指标,结合评估人员数据质量评估经验进行数据评估,如资料判断、经
验判断等。
评估机构应根据委托主体及被评估数据,确定数据评估方式,评估方式包括:
a) 全量评估:对涉及的所有数据进行逐一评估;
b) 增量评估:对涉及的数据,在特定的范围和时间段内新增的数据进行逐一评估;
c) 抽样评估:按照抽样方案,对抽取的数据进行逐一评估。
4.3.2 评估工具
评估机构应根据数据类型,如文本、图像、音频、视频以及三维模型等,选用相应的数据质量评估
软件和工具。
4.3.3 指标确定
评估机构应参考T/CECC 31.1、T/CECC 31.2、T/CECC 31.3建立用于数据质量评估的指标体系,如
图2所示。
T/CECC 32—2024
4
图2 数据质量评估指标体系
4.3.4 指标权重
评估机构应根据数据所支持业务对指标属性要求的不同,包括合规性、规范性、完整性、准确性、
一致性、共享性以及时效性,利用相关权重确定方法,确定不同类型指标权重,不同类型指标权重之和
为1。
评估机构应根据基于数据所开展的业务对指标内容的要求,利用相关权重确定方法,对指标赋予分
值,同一类型指标分值相加为100分,部分指标赋值情况可参考附录A。数据内容与评估对象应用场景
相关性较大或与评估日期较为接近时,相关数据内容在完整性、准确性与一致性上应赋予较大权重。
相关权重确定方法可使用以下方法:
a) 专家评分法:通过领域内专家对各个指标的重要性评价计算指标权重;
b) 层次分析法:通过数据层次结构,比较不同指标之间的相对重要性确定指标权重;
c) 熵权法:基于数据信息熵,通过指标的信息熵大小确定指标权重。
评估机构宜采用主客观结合的方法确定权重。
4.3.5 评估实施
评估机构基于评估准备阶段活动内容,以及评估方法、评估工具、指标确定、指标权重内容,实施
评估活动。
4.4 评估结束阶段
4.4.1 评估结果
评估机构应针对数据质量结果开展分析,识别数据中的全部质量问题。
评估机构应基于数据质量评估过程及结果编制详实的数据质量评估报告,报告内容应包括但不限于
评估结果、数据质量分析、数据质量存在问题以及数据质量改进建议。
4.4.2 改进建议
评估机构应及时向委托主体反馈数据质量评估结果与数据质量问题。
评估机构应针对数据质量结果制定数据质量改进计划,针对数据质量问题制定具体改进措施,并根
据数据质量问题严重程度及对业务影响大小对改进措施进行优先级排序。
5 判定方法
T/CECC 32—2024
5
数据质量评分采用加权平均的方法计算,具体计算方法如公式(1)所示。
D = i
评论