HY/T 0473-2025 海洋温盐数据排重技术规范

文档天下 图书评论5阅读模式

资源简介

ICS 07. 060 CCS A 45

中华人民共和国海洋行业标准

HY/T 0473—2025

海洋温盐数据排重技术规范

Technicalspecification foreliminatingduplicatesofoceanographic

temperatureand salinitydata

2025-02-06发布 2025-05-01实施

中华人民共和国自然资源部发 布

HY/T 0473—2025

目次

前言 Ⅲ

1 范围 1

2 规范性引用文件 1

3 术语和定义 1

4 海洋温盐重复数据的排除原则 1

5 海洋温盐数据排重流程 2

参考文献 5

HY/T 0473—2025

前言

本文件按照 GB/T 1. 1—2020《标准化工作导则第 1部分 :标准化文件的结构和起草规则》的规定起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由中华人民共和国自然资源部提出。

本文件由全国海洋标准化技术委员会(SAC/TC 283)归口。

本文件起草单位 : 国家海洋信息中心。

本文件主要起草人 :纪风颖、刘玉龙、徐珊珊、董明媚、岳心阳、骆敬新。

HY/T 0473—2025

海洋温盐数据排重技术规范

1 范围

本文件确立了海洋常用观测仪器获取的海洋温盐重复数据的排除原则 ,规定了海洋温盐数据的排重流程。

本文件适用于 11种仪器所获得的海洋温盐数据的排重工作。

2 规范性引用文件

本文件没有规范性引用文件。

3 术语和定义

下列术语和定义适用于本文件。

3. 1

关键信息项 keyitem

表征温盐数据的数值、精度以及观测仪器等字段。

注 : 包括观测仪器、观测时间、观测经纬度、观测层深、温度和盐度。

3.2

辅助信息项 assistantitem

用于说明温盐数据来源的背景信息。

注 : 包括调查国家、调查机构、调查项目、整编项目、数据集名称等。

3.3

重复数据 duplicatedata

由于重复接收、收集或存储所造成的关键信息项完全相同的数据或满足从属关系的数据。

3.4

准重复数据 nearduplicatedata

观测时间和经纬度相同 ,且水下观测数据 90%以上相同的测站数据。

4 海洋温盐重复数据的排除原则

海洋温盐数据排重工作需确保最终成果数据来源真实、信息完整、数据可靠和结果唯一 ,具体原则包括以下内容。

a) 来源真实 :保留从原始调查者获取的一手数据 ,剔除再收集数据。

b) 信息完整 :

1) 保留资料内容、类型以及元数据信息完整的数据 ,剔除片段数据 ;

2) 优先保留主体观测仪器的资料 ,删除或标识辅助的比测资料。

c) 数据可靠 :保留观测数据精度与仪器性能相匹配的数据 ,剔除人工修改/插值及多次转存精度变化的数据。

1

HY/T 0473—2025

d) 结果唯一 :排重工作完成后 ,保证成果数据中不再有重复记录。

5 海洋温盐数据排重流程

5. 1 计算机判定标识海洋温盐重复数据

5. 1. 1 计算机判定海洋温盐重复数据的关键信息项

根据现有温盐数据的组成和存储方式 ,将海洋温盐重复数据判定的关键信息项设定为观测仪器、观测时间、观测经纬度、观测层深、温度和盐度。

5. 1.2 海洋温盐数据关键信息项相同的判定阈值

对目前应用广泛(获取数据最多)的 11种海洋温盐观测仪器 :颠倒温度计、温盐深仪(Conductivity Temperature Depth,CTD)、机械式温深仪(Mechanical Bathythermograph, MBT)、抛弃式温深仪(Ex- pendable Bathythermograph,XBT)、海表面温盐记录仪、海洋游泳动物携带温盐深仪、锚定浮/潜标、剖面浮标 ( Argo)、漂流 浮标 (本文 件中 漂流 浮标 包括 漂流 温度 链或 CTD 链 )、拖曳 式温 盐深 仪(Undulating Conductivity Temperature Depth,UCTD)以及水下滑翔机(Glider) ,依据其传感器精度、观测方式和数据传输 方式 , 判定 海洋 温盐 数据 是否 重复 的阈 值 , 即关 键信 息项 相同 的阈 值包 括如 下内容。

a) 本文件推荐测站位置相同的阈值为 10 m。具体使用过程中 , 可根据卫星定位系统精度 , 以及温盐数据获取过程中位置的变动范围进行调整。

b) 测站时间相同阈值包括如下内容。

1) 对于人工下放观测的颠倒温度计、CTD、MBT 和 XBT,观测时间相同的阈值为完成一个测站观测所需的最少时间 ;

2) 对于自动观测的 Argo浮标、漂流浮标、Glider和 UCTD, 观测时间相同阈值为完成一次观测所需时间的最小值 , 以 Glider为例 ,其完成一次观测基本为 3 h~ 9 h,则该仪器观测时间相同的阈值为 3 h;

3) 对于海洋游泳动物携带温盐深仪 ,本文件推荐观测时间相同阈值为 1 min,实际工作中可根据动物下潜和上浮时间间隔进行调整 ;

4) 对于志愿船携带的海表面温盐记录仪 ,本文件推荐该仪器观测时间相同的阈值为 10 s,实际工作中 ,可根据仪器观测频率和测站的实际时间间隔调整该参数。

c) 本文件推荐观测层深相同的阈值为 1 m。实际工作中可根据观测仪器所携带的压力传感器的精度进行调整。

d) 本文件推荐水下温盐数据相同的阈值包括如下内容。对于观测主体为 CTD 的下放式 CTD、 XCTD、UCTD、漂流浮标、Argo、Glider、海洋游泳动物携带温盐深仪 ,观测数据相同的标准为同层观测数据温度差异不大于 0. 01 ℃ ,盐度差异不大于 0. 01。对于观测主体为 BT 的 MBT、 XBT 和海面浮子 ,综合其传感器精度 , 同层温度相同的判定阈值为 0. 1 ℃。

以上仪器获取温盐数据是否重复的判定阈值见表 1。

2

HY/T 0473—2025

表 1 不同仪器获取温盐数据是否重复的判定阈值

观测仪器

测站时间间隔

测站距离m

同层温度差异℃

同层盐度差异

PSS-78

CTD

2 h

10

0. 01

0. 01

UCTD

1 h

10

0. 01

0. 01

Argo

6 h

10

0. 01

0. 01

Glider

3 h

10

0. 01

0. 01

漂流浮标

1 h

10

0. 01

0. 01

颠倒温度计

1 h

10

0. 01

0. 01

锚定浮/潜标

5 min

10

0. 1

0. 1

海洋游泳动物携带温盐深仪

1 min

10

0. 1

0. 1

海表面温盐记录仪

1 min

10

0. 1

0. 1

XBT

10 min

10

0. 1

MBT

2 h

10

0. 1

实际温盐数据排重工作中可以根据传感器精度、观测方式和站位水深等信息 ,并结合排重结果 ,对表 1 中各种阈值进行适度调整。

对于表 1 中未列入的观测仪器 ,温盐重复数据判定阈值可依据传感器精度和观测方式进行设定。

5. 1.3 海洋温盐重复数据的计算机判定算法

5. 1.3. 1 测站时间和位置重复的判定

任意测站 A站和 B站 , 当二者的距离不大于 10 m ,而且观测时间差异小于该仪器观测时间相同的阈值 ,则认为 A 和 B为可能重复测站 ,进行下一步判断 ,否则二者非重复数据 ,不再进行以下判断过程。

5. 1.3.2 水下温盐数据重复的判定

对于 5. 1. 3. 1 中判 断的 可能 重复 测站 A 站和 B 站 , 为描 述方 便 , 命名 总层 次数 较多 的测 站为 A站 ,总层次数据较少的测站为 B站 , 即 A 的层次数大于或等于 B 的层次数 ,并按照 5. 1. 2 中的 c)取出 A和 B 中相同层深的数据 ,分别组成新的子集 C(C∈A)和 D(D∈B)。

判断 A站与 B站水下温盐数据是否重复的算法具体如下 :

a) 当 D层次个数小于 B 总层次数的 90% ,则 A、B两个站水下温盐数据不重复 ;

b) 当 C 和 D所有温盐数据满足 5. 1. 2 的温盐重复数据的参数 ,则对 B站水下温盐数据进行重复数据的标识 ;

c) 当 C 和 D 同层温盐数据不满足 5. 1. 2 的温盐重复数据的参数 ,则 A、B两个站水下温盐数据不重复。

5. 1.4 海洋温盐重复数据的标识

根据海洋温盐数据是否重复的计算机判定结果 ,对相应的测站进行标识 ,为后期人工审核和确认提供依据。具体标识方法如下 :

a) 对于未出现重复数据的站点 ,站点重复数据标识符均设定为“0”;

b) 对于 A、B、C等多个测站 ,所有关键信息项相同 ,则将这些站点数据归为同一个数据组 ,站点重

3

HY/T 0473—2025

复数据标识符均设定为“1”;

c) 对于 A、B、C等多个测站 ,时间地点相同 ,但是 B、C等站点的观测数据为 A 的子集 ,则将 A、B、 C等站点归为同一个数据组 ,站点重复数据标识符分别设定为“1”“2”“2”等。

5.2 海洋温盐重复数据人工审核和确认

5.2. 1 海洋温盐重复数据判定的辅助信息项

辅助信息项包括调查国家、调查机构、调查项目、调查航次、调查船、首席专家等信息。

5.2.2 海洋温盐重复数据人工审核和标识

计算机自动判断和标识重复数据和准重复数据后 ,需人工对标识符进行审核。基于关键信息项的差异情况 ,结合相应的辅助信息项 ,对温盐重复数据进行认可或修正 ,具体操作如下。

a) 对于关键信息项完全相同的数据组 ,对调查资料进行溯源 , 明确资料的来源 :调查项目、首席专家 ,对保留原始收集者/负责人获取的观测数的站点重复数据标识符设定为“1”,其他数据的标识符设定为“2”。

b) 对于满足从属关系的重复数据组 ,若为卫星等自动重复接收同一个站点/仪器的数据 ,选取数据最为完整的数据 ,将其站点重复数据标识符设定为 “1”,其余相同或片段数据的重复数据标识符设定为“2”。

c) 对于满足从属关系的重复数据组 ,若为原始数据和后期插值/抽稀数据共存情况 ,则选取数据最为完整的原始数据 ,将其站点重复数据标识符设定为 “1”,其余相同或片段数据的重复数据标识符设定为“2”。

d) 对于关键信息项完全相同的多来源国际数据的重复数据组 ,将最初观测计划/收集者获取的观测数据的站点重复数据标识符设定为“1”,其余相同或片段数据的重复数据标识符设定为“2”。

e) 对于收集到来源/观测计划/调查人等不明确的观测数据重复数据组 ,人工审核其数据精度和辅助信息项 ,将精度更为接近调查仪器精度、信息更全面的站点重复数据标识符设定为“1”,其余相同或片段数据的重复数据标识符设定为“2”。

5.3 海洋温盐重复数据的剔除

计算机剔除重复数据标识符为“2”的测站数据。

4

HY/T 0473—2025

参考 文献

[1] 纪风颖 , 于婷 , 董明媚 , 等 . WOD与 Argo数据集的排重方法与软件实现[J] . 中国海洋大学学报 ,2015, 45(8) :121-127.

资源下载此资源下载价格为6金币立即购买,VIP免费

1.本站大部份文档均属免费,部份收费文档,经过本站分类整理,花了精力和时间,收费文档是为了网站运营成本等费用开支;
2.购买会员(或单次下载)即视为对网站的赞助、打赏,非商业交易行为(不认同此观点请勿支付)请慎重考虑;
3.所有收费文档都真实可靠,为了节约成本,文档在网站前台不做预览,如果付费后,与实际文档不符合,都可以加微信号:pdftj888申请退款;
4.付费下载过程中,如果遇到下载问题,都可以加微信号pdftj888解决;
5.手机支付,尽量选择支付宝支付;
6.如图集或者标准不清楚,在本站找不到您需要的规范和图集,希望增加资料等任何问题,可联系微信号:pdftj888解决;

文档天下
  • 本文由 发表于 2026年6月17日 09:39:08
  • 转载请务必保留本文链接:https://www.998pdf.com/75232.html
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: