T/CPRA 2101.2-2024 中华民族文化基因库技术要求 第2部分:基因数据质量要求 ,该文件为pdf格式 ,请用户放心下载!
尊敬的用户你们好,你们的支持是我们前进的动力,网站收集的文件并免费分享都是不容易,如果你觉得本站不错的话,可以收藏并分享给你周围的朋友。
如果你觉得网站不错,找不到本网站,可以百度、360搜搜,搜狗, 神马搜索关键词“文档天下”,就可以找到本网站。也可以保存到浏览器书签里。
收费文件即表明收集不易,也是你们支持,信任本网站的理由!真心非常感谢大家一直以来的理解和支持!
CCS L 70
团体标准
T/CPRA 2101.2—2024
中华民族文化基因库技术要求 第2部分:基因数据质量要求
Technical requirements of gene database of Chinese culturePart 2: Gene data quality requirements
2024-12-13 发布2024-12-13 实施
中国公共关系协会文化大数据产业委员会发布
目次
前言............................................................................... II
1 范围............................................................................... 1
2 规范性引用文件..................................................................... 1
3 术语和定义......................................................................... 1
3.1 中华民族文化基因库............................................................ 1
4 总体要求........................................................................... 1
4.1 原则........................................................................... 1
4.2 数据范围....................................................................... 1
4.3 数据格式....................................................................... 2
4.4 数据文件命名原则............................................................... 2
4.5 逻辑一致性要求................................................................. 2
4.6 实时性要求..................................................................... 2
5 数据质量要求....................................................................... 2
5.1 核心元数据要求................................................................. 2
5.2 数据文件质量要求............................................................... 6
5.3 数据质量保真要求............................................................... 7
T/CPRA 2101.2-2024
II
前言
本文件按照GB/T 1.1—2020《标准化工作导则第1 部分:标准化文件的结构和起草规则》的
规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由中国公共关系协会文化大数据产业委员会提出并归口。
本文件起草单位:北京邮电大学、北京玖扬科技有限公司、伏羲云(北京)文化科技有限公
司。
本文件主要起草人:徐坤、高凯、赵海英、薛晓鹏、尹晖、侯小刚、周月、徐鹏举、李伟、
崔义娜、陈磊、刘志军、李媛媛。
T/CPRA 2101.2-2024
1
中华民族文化基因库技术要求
第2 部分:数据质量要求
1 范围
本文件规定了国家文化大数据体系中中华民族文化基因库数据的质量要求,包括总体要求和
数据质量要求等。
本文件适用于国家文化大数据体系中中华民族文化基因库设计、研发等。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引
用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修
改单)适用于本文件。
GB/T 1.1-2020 标准化工作导则第1 部分:标准化文件的结构和起草规则
T/CPRA 1-2021 国家文化大数据标准体系
T/CPRA 300-2023 文化数字内容分类与代码
T/CPRA 301-2023 文化资源数据分类与代码
3 术语和定义
下列术语和定义适用于本文件。
3.1 中华民族文化基因库gene database of Chinese culture
中华民族文化基因库的数据主要来自革命文物大数据库和博物馆大数据体系,通常经过高精
度数据采集,导入国家文化大数据体系底层关联集成系统,完成数据标注、关联,并提取中华民
族文化元素、符号和标识,最终形成中华民族文化基因库。相关数据通过国家文化专网实现共享。
[来源:T/CPRA 301-2023 定义3.1.3]
4 总体要求
4.1 原则
数据质量原则要求应满足:
a) 准确性,数据记录来源可靠,数据记录准确;
b) 守正性,数据应以事实为依据,符合社会主义核心价值观;
c) 完整性,数据记录完整,不遗留;
d) 及时性,数据出现变化应及时修正更新。
4.2 数据范围
中华民族文化基因库数据对象是:
T/CPRA 2101.2-2024
2
a) 公共文化服务机构高清数字化采集形成的数据;
b) 从文化遗产中提取的中华民族文化元素、符号和标识数据。
4.3 数据格式
中华民族文化基因库数据格式主要包括图片、视频、文字、音频、三维模型,具体格式要求
如下:
a) 图片格式:BITMAP 、JPEG、TIFF、PDF、PNG、PSD、RAW、SVG。
b) 视频格式:MPEG、AVI、MOV、FLV/ F4V。
c) 文字格式:TXT。
d) 音频格式:WAVE、AIFF、MP3、MIDI、WMA、APE、FLAC。
e) 三维模型格式:OSGB、OBJ、FBX、STL、3DS。
4.4 数据文件命名原则
4.4.1 数据集(目录)命名原则
数据集命名原则要求如下:
a) 数据集命名应按照存储格式进行分类,如图片、视频、音频、文字等;
b) 数据集命名宜采取多级目录结构;
c) 数据集命名不宜使用特殊字符,如@,#,$,%,^,&,*,¥,~,/等字符。
4.4.2 单一数据命名原则
单一数据命名原则要求如下:
a) 单一数据文件命名规则宜按照文件数据名-{序号}.{文件格式} 进行命名;
b) 单一数据命名中的文件数据名部分宜采用英文字母进行命名;
c) 单一数据命名中不宜出现@,#,$,%,^,&,*,¥,~,/等特殊字符。
4.5 逻辑一致性要求
逻辑一致性应满足以下要求:
a)概念一致性:文化基因分类与代码、数据结构、属性、文化基因间关系在同一尺度上应保
持一致,在不同尺度上应符合统一的体系规则;
b)值域一致性:数据项的取值应在值域的界定范围内;
c)格式一致性:数据存储应与数据集物理结构及规定格式保持一致。
4.6 实时性要求
可按需求定期或及时对数据进行更新,保持数据的实时性。元数据属性中应包含时间标识。
5 数据质量要求
5.1 核心元数据要求
表1 图片元数据
元数据字段CODE 必填类型长度
名称titleName 是字符串300
文化数据标识符identifiers 是字符串100
T/CPRA 2101.2-2024
3
其他标识符otherIdentifiers 否字符串100
服务类型serviceType 自动获取字符串100
贡献者contributors 是字符串300
著作权人copyrightOwner 是字符串100
载体carrier 是受控词100
登记者registrant 自动获取字符串100
登记日期registerDate 自动获取日期100
描述description 是字符串400
标签label 否字符串100
分辨率imageClarity 自动获取字符串100
大小metadataFileSize 自动获取字符串100
格式metadataFileFormat 自动获取字符串100
高度imageHeight 自动获取字符串100
长度imageWidth 自动获取字符串100
存储地址addressUrl 自动获取字符串100
预览文件存储地址previewAddressUrl 自动获取字符串100
文件MD5 md5Val 自动获取字符串100
版权登记号copyrightRegNo 否字符串100
版权归属copyrightOwnerShip 否字符串100
版权开始时间copyrightDurationStart 否日期100
版权结束时间copyrightDurationEnd 否日期100
表2 三维模型元数据
元数据字段CODE 必填类型长度
名称titleName 是字符串300
文化数据标识符identifiers 是字符串100
其他标识符otherIdentifiers 否字符串100
描述description 否字符串400
服务类型serviceType 自动获取字符串100
贡献者contributors 是字符串300
著作权人copyrightOwner 是字符串100
载体carrier 是受控词100
登记者registrant 自动获取字符串100
登记日期registerDate 自动获取日期100
标签label 否字符串100
大小metadataFileSize 自动获取字符串100
T/CPRA 2101.2-2024
4
格式metadataFileFormat 自动获取字符串100
存储地址addressUrl 自动获取字符串10)
预览文件存储地址previewAddressUrl 自动获取字符串100
三维类别typed 是受控词100
文件MD5 md5Val 自动获取字符串100
版权登记号copyrightRegNo 否字符串100
版权归属copyrightOwnerShip 否字符串100
版权开始时间copyrightDurationStart 否日期100
版权结束时间copyrightDurationEnd 否日期100
表3 视频元数据
元数据字段CODE 必填类型长度
名称titleName 是字符串300
文化数据标识符identifiers 是字符串100
其他标识符otherIdentifiers 否字符串100
服务类型serviceType 自动获取字符串100
贡献者contributors 是字符串300
著作权人copyrightOwner 是字符串100
载体carrier 是受控词100
登记者registrant 自动获取字符串100
登记日期registerDate 白动获取日期100
描述edition 是字符串400
标签escription 否字符串100
大小label 自动获取字符串100
格式metadataFileSize 白动获取字符串100
分辨率metadataFileFormat 自动获取字符串100
时长playTime 自动获取字符串100
存储地址addressUrl 自动获取字符串100
预览文件存储地址previewAddressUrl 自动获取字符串100
MD5 md5Val 白动获取字符串100
版权登记号copyrightRegNo 否字符串100
版权归属copyrightOwnerShip 否字符串100
版权开始时间copyrightDurationStart 否日期100
版权结束时问copyrightDurationEnd 否日期100
T/CPRA 2101.2-2024
5
表4 音频元数据
元数据字段CODE 必填类型长度
名称titleName 是字符串300
文化数标识符identifiers 是字符串100
其他标识符otherIdentifiers 否字符串100
服务类型serviceType 自动获取字符串100
贡献者contributors 应字符串300
著作权人copyrightOwner 是字符串100
载体carrier 是字符串100
登记者registrant 自动获取字符串100
登记日期registerDate 自动获取日期100
版本edition 是受控词100
描述escription 是字符串400
标签label 否字符串100
大小metadataFileSize 自动获取字符串100
采样频率metadataKHz 否字符串50
格式metadataFileFormat 自动获取字符串100
时长playTime 自动获取字符串100
存储地址addressUrl 自动获取字符串100
预览文件存储地址previewAddressUrl 自动获取字符串100
文件MD5 md5Val 自动获取字符串100
版本登记号copyrightRegNo 否字符串100
版权归属copyrightOwnerShip 否字符串100
版权开始时间copyrightDurationStart 否日期100
版权结束时问copyrightDurationEnd 否日期100
表5 文本元数据
元数据字段CODE 必填类型长度
名称titleName 是字符串300
文化数据标识符identifiers 是字符串100
其他标识符otherIdentifiers 否字符串100
服务类型serviceType 自动获取字符串100
贡献者contributors 是字符串300
著作权人copyrightOwner 是字符串100
载体carrier 是受控词100
登记者registrant 自动获取字符串100
登记日期registerDate 自动获取日期100
T/CPRA 2101.2-2024
6
描述description 是字符串400
标签label 否字符串100
大小metadataFileSize 自动获取字符串100
格式metadataFileFormat 自动获取字符串100
语种language 是受控词100
存储地址addressUrl 自动获取字符串100
预览文件存储地址previewAddressUrl 自动获取字符串100
文件MD5 md5Val 自动获取字符串100
版权登记号copyrightRegNo 否字符串100
版权归属copyrightOwnerShip 否字符串100
版权开始时间copyrightDurationStart 否日期100
版权结束时间copyrightDurationEnd 否日期100
5.2 数据文件质量要求
5.2.1 平面图像数据
表6 平面图像数据质量标准
格式文件扩展名分辨率要求
BITMAP(位图) .bmp 位深为24 位或32 位
JPEG(联合图片专家组) .jpg JPEG 压缩编码> 2.0 位/像素
TIFF(标记图像格式) .tif,.tiff 分辨率≥ 300dpi
PDF(可移植文档格式) .pdf 分辨率≥ 300dpi
PNG .png 位深≥ 24 位,分辨率≥ 300dpi
PSD .psd 分辨率≥ 300dpi
RAW .raw 分辨率≥ 300dpi
SVG .svg 分辨率≥ 72ppi
5.2.2 三维模型数据
表7 三维模型数据质量标准
文件格式文件扩展名精度要求
Open Scene Gragh Binary .osgb 厘米级精度
OBJ .obj 面片数量> 100000 个;包含贴图与材质
FBX .fbx 面片数量> 100000 个
STL .stl 面片数量> 100000 个
3DS .3ds 厘米级精度
T/CPRA 2101.2-2024
7
5.2.3 视频数据
表8 视频数据质量标准
文件格式文件扩展名分辨率要求
MPEG 格式.mp4, .mpg 分辨率≥1080p,帧率≥60Hz
AVI 格式.avi 分辨率≥1080p,帧率≥60Hz
MOV 格式.mov 分辨率≥1080p,帧率≥60Hz
FLV/ F4V 格式.flv 分辨率≥1080p,帧率≥60Hz
5.2.4 音频数据
表9 音频数据质量标准
文件格式文件扩展名码率
WAVE 格式.wav 采样率≥44.1khz,采样精度≥16bit
AIFF 格式.aiff 采样率≥44.1khz,采样精度≥16bit
MP3 格式.mp3 采样率≥44.1khz,采样精度≥16bit
MIDI 格式.mid 采样率≥44.1khz,采样精度≥16bit
WMA 格式.wma 采样率≥44.1khz,采样精度≥16bit
APE 格式.ape 采样率≥44.1khz,采样精度≥16bit
FLAC 格式.flac 采样率≥44.1khz,采样精度≥16bit
5.2.5 文本数据
表10 文本数据质量标准
文件格式文件扩展名
格式.txt,.pdf ,.epub,.xml
5.3 数据质量保真要求
数据的处理应满足下列要求:
a)数据处理后产生的误差应控制在允许范围之内,数据库中图片的精度应与数据的精度保持
一致。
b)数据库中要素的属性应与数据要素的属性保持一致。
c)数据处理后数据的完整性和一致性不应降低。
d)数据或要素更新后不得与相关数据或相关要素发生关系或相关属性矛盾。
e)数据处理过程中应保留的内容不得丢失。
评论