ICS 35.240
CCS
CCUA
L 67
中国计算机用户协会团体标准
T/CCUA 049—2025
油气勘探 高性能计 算集群性能 测试方法
Oil and gas exploration-Performance of high-performance computing clusters-Test
methods
2025 - 05 - 30 发布 2025 - 07 - 01 实施
中国计算机用户协会 发布
T/CCUA 049—2025
I
目次
前言 ................................................................................. II
引言 ................................................................................ III
1 范围 ............................................................................... 1
2 规范性引用文件 ..................................................................... 1
3 术语和定义 ......................................................................... 1
4 缩略语 ............................................................................. 1
5 测试环境要求 ....................................................................... 2
6 系统性能测试方法 ................................................................... 2
测试项目 ....................................................................... 2
测试信息 ....................................................................... 2
测试工具要求 ................................................................... 2
测试步骤 ....................................................................... 3
测试结果数据处理 ............................................................... 3
7 应用性能测试方法 ................................................................... 3
测试项目 ....................................................................... 3
测试数据 ....................................................................... 4
测试信息 ....................................................................... 4
测试工具要求 ................................................................... 4
测试步骤 ....................................................................... 5
测试结果数据处理 ............................................................... 5
8 测试报告 ........................................................................... 6
附录A(资料性) 节点硬盘IO 性能测试 .................................................. 7
附录B(资料性) 节点内存性能测试 ..................................................... 9
附录C(资料性) 网络性能测试 ........................................................ 10
附录D(资料性) 存储性能测试 ........................................................ 12
附录E(资料性) 整体性能测试 ........................................................ 13
附录F(规范性) 应用测试数据 ........................................................ 14
附录G(资料性) 测试报告内容 ........................................................ 16
参考文献 ............................................................................. 19
T/CCUA 049—2025
II
前言
本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定
起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由中国计算机用户协会提出并归口。
本文件起草单位:中石化石油物探技术研究院有限公司、中国计算机用户协会石油和化工信息技术
应用分会、中国石油集团东方地球物理勘探有限责任公司、中海油田服务股份有限公司。
本文件主要起草人:包红林、庞凯元、李博、胡光辉、袁刚、吴伟、葛鑫、张效斌、张旭东、徐雷、
杨子兴、武永山、王丽、杨广新、张萌、李敏、王豆豆。
T/CCUA 049—2025
III
引言
随着油气勘探项目地震数据量的剧增,数据处理对高性能计算集群需求快速增长。高性能集群由处
理器、内存、网络和存储等技术产品构建,这些产品的技术性能各不相同,且不同的高性能应用领域应
用软件对集群的技术性能需求也不尽相同,导致实测集群计算性能差异较大,集群建设方案论证评估工
作缺少规范性和精准性。本文件依据油气勘探领域高性能应用对集群技术性能的需求,采用通用基准测
试软件构建集群系统性能测试方法,选用计算、内存、硬盘等典型资源需求应用软件,构建应用性能测
试方法,为高性能集群建设与验收阶段性能测试工作提供规范性与精准性指导。
T/CCUA 049—2025
1
油气勘探 高性能计算集群性能 测试方法
1 范围
本文件规定了油气勘探高性能计算集群系统测试的总体要求、系统性能测试和应用性能测试方法。
本文件适用于油气勘探行业高性能计算集群性能测试,其他行业也可参照使用。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T 41779-2022 高性能计算机系统能效测试方法
3 术语和定义
下列术语和定义适用于本文件。
高性能计算集群 high performance computing cluster
同时使用多个计算节点,用于处理大量数据或解决大规模数值计算问题的计算机系统。
[来源:GB/T 41779-2022,3.1]
峰值性能 peak performance
高性能计算机系统可获得的最高理论性能值。
共炮检距矢量片 offset vector tile
对三维地震数据,按炮检距和方位角进行分组,由大致相同炮检距和方位角的地震道所组成的数据
子集。
[来源:SY/T 7615-2021,3.2]
炮集 shot gather
在地震勘探中,由单次人工震源激发(如炸药、气枪或振动源等)后,由多个检波器接收到的地震
波信号所组成的数据集。
全波形反演 full waveform inversion
利用波动方程地震波模拟波场与实际采集数据进行匹配,通过数学反演获得地下地质特征分布的
一种深度域地震反演建模方法。
逆时偏移 reverse time migration
利用双程波动方程,基于时间逆时外推进行波场重构的一种深度域成像方法。
叠前时间偏移 prestack time migration
基于地下速度横向均匀假设,通过计算每个地震道的旅行时,在时间域进行叠加的一种成像方法。
4 缩略语
T/CCUA 049—2025
2
下列缩略语适用于本文件。
CMP:共中心点道集(Common Middle Point)
CPU:中央处理器(Central Processing Unit)
GPU:图形处理器(Graphics Processing Unit)
HPC:高性能计算(High Performance Computing)
HPL:高性能Linpack测试软件包(High Performance Linpack)
IO:输入输出(Input Output)
MPI:并行计算通讯应用接口(Message Passing Interface)
OVT:共炮检距矢量片(Offset Vector Tile)
VTI:水平横向各向同性(Vertical Transverse Isotropy)
5 测试环境要求
测试环境要求如下:
a) 温度:18℃~28℃;
b) 相对湿度:40%~70%(不应结露);
c) 大气压:86kPa~106kPa。
6 系统性能测试方法
测试项目
包括节点硬盘IO、内存、网络、存储等单项测试和整体计算性能测试。
测试信息
每项测试次数不少于5 次,对测试异常值或最高、最低值剔除后取3 次测试结果数据进行均值计算
作为最终测试结果数据。测试信息见表1。
表1 测试信息
测试项目 测试对象 测试工具 节点数(个) 测试结果
节点硬盘IO性能测试 节点内置数据盘
IO性能基准测试软件
(见附录A)
1
文件顺序读写模式下
硬盘读写带宽
节点内存性能测试 节点内存
内存性能基准测试软
件(见附录B)
1
持续运行内存带宽最
大值
网络性能测试 集群节点间网络
网络性能基准测试软
件(见附录C)
2
节点间MPI点对点通
信的网络带宽和延时
存储性能测试 集群存储系统
存储性能基准测试软
件(见附录D)
10
大文件读写场景下存
储系统读写带宽
整体计算性能测试 集群全部计算节点
整体性能基准测试软
件(见附录E,或选用
GB/T 41779-2022中第
7章给出的软件)
全部计算节点
集群双精度浮点计算
速度
测试工具要求
测试工具要求见表2。
T/CCUA 049—2025
3
表2 测试工具要求
测试工具 参数 参数说明 参数是否调整
IO性能基准测试软件
direct=1
bs=128K
rw=read或write
numjobs=16
size=100G
ioengine=psync
见附录A.4.1 否
节点内存性能测试软件 N大于0.5×CPU三级缓存总容量 测试数据量 是
网络性能测试软件 无 无 否
存储性能测试软件
节点启动进程数np
文件块大小blocksize
无 是
整体计算性能测试软件
矩阵大小N
矩阵分块值
选用按列排列的处理器阵列排列方式
网格尺寸
无 是
测试步骤
6.4.1 测试准备
测试准备工作包括测试软件下载与编译,详见附录A至附录E的相关内容。
6.4.2 测试执行
详见附录A至附录E相关内容。
6.4.3 测试结果数据获取
详见附录A至附录E相关内容。
测试结果数据处理
6.5.1 单项测试结果数据处理
采用以下方法进行结果数据处理:
d) 将节点硬盘IO、内存和网络性能测试结果数据分别与系统测试结果数据库中对应测试项目的
测试结果进行比对,给出测试结果所处位次;
e) 将存储性能测试结果数据与近3 年IO500 10 节点榜单(高性能计算领域反映存储系统为应用
提供IO 性能的权威榜单)性能数据进行比对,给出测试结果所处位次。
6.5.2 整体计算性能测试结果数据处理
采用以下方法进行结果数据处理:
a) 将整体性能测试结果数据与系统测试结果数据库中整体性能数据进行比对,给出测试结果所
处位次;
b) 将整体性能测试结果数据与集群峰值性能相除得到集群计算效率,与系统测试结果数据库中
的集群计算效率进行比对,给出测试结果所处位次。
7 应用性能测试方法
测试项目
测试项目包括常规处理测试和偏移成像测试。
T/CCUA 049—2025
4
测试数据
应用性能测试数据说明见表3。
表3 应用性能测试数据表
测试项目 测试数据集 数据集数量(套) 测试数据规定
常规处理测试
炮集测试数据 1 应符合附录F中的F.1
CMP道集测试数据 1 应符合附录F中的F.1
偏移成像测试
叠前时间偏移测试数据 1 应符合附录F中的F.2
叠前深度偏移测试数据 1 应符合附录F中的F.3
逆时偏移测试数据 1 应符合附录F中的F.4
全波形反演测试数据 1 应符合附录F中的F.5
测试信息
每项测试次数不少于5次,对测试异常值或最高、最低值剔除后取3次测试结果数据进行均值计算作
为最终测试结果数据。测试信息见表4。
表4 测试信息
测试项目 应用资源需求类型 测试工具 节点数(个) 测试数据集 测试结果
常规处理测
试
内存容量敏感型
地表一致性反褶积
处理软件
1 炮集测试数据
测试作业
运行时长
内置临时盘敏感型 分选处理软件 1 CMP道集测试数据
计算与大内存敏感型 五维插值处理软件 10 CMP道集测试数据
偏移成像测
试
超大计算
弯曲射线Kirchhoff
叠前时间偏移软件
全部计算节点 叠前时间偏移测试数据
VTI Kirchhoff叠前
深度偏移软件
全部计算节点 叠前深度偏移测试数据
超大计算与内存
检查点波场数据存
储VTI逆时偏移成像
软件
1
逆时偏移测试数据中同
一炮集数据
全部计算节点 逆时偏移测试数据
VTI全波形反演正演
计算软件
1
全波形反演测试数据中
同一炮集数据
全部计算节点 全波形反演测试数据
测试工具要求
测试工具要求见表5。
表5 测试工具要求
测试工具 测试参数
地表一致性反褶积处理软件
分解域数量:4
分块处理数据量:根据节点内存容量确定
分选处理软件
使用全偏移距
使用最大道数
分选道头字: cmpline,cmp,offset
使用道集最大道数
T/CCUA 049—2025
5
表5 测试工具要求(续)
测试工具 测试参数
五维插值处理软件
迭代次数:400(或频率分解百分比:70%)
插值维度:5
空间窗宽度:14
重叠窗口(OVT输入道集):30%
弯曲射线Kirchhoff叠前时间偏移软件
基于覆盖次数的振幅均衡
采样大小:≤4ms
反假频参数:50m×25m
最大孔径(半径):5000m
VTI Kirchhoff叠前深度偏移软件
采样大小:≤4ms
反假频参数 :40m×20m
最大孔径(半径):5000m
检查点波场数据存储VTI逆时偏移成像软件
最大频率:50Hz
延拓步数:6000
VTI全波形反演正演计算软件
吸收边界:20
空间差分精度:4
延拓步数:2000
测试步骤
7.5.1 测试准备
准备工作包括:
a) 安装部署测试工具软件;
b) 拷贝测试数据集到集群存储系统;
c) 建立测试用户账户并配置软件运行环境,针对多节点并行场景,配置节点并行环境。
7.5.2 测试执行
7.5.2.1 常规处理测试
测试步骤如下:
a) 启动处理系统;
b) 建立测试项目工区;
c) 选择测试处理软件,添加输入与输出软件,建立测试处理流程;
d) 在交互界面输入测试数据文件名、测试参数和输出数据文件名等;
e) 保存测试流程,提交测试运行。
7.5.2.2 偏移成像测试
测试步骤如下:
a) 检查测试数据文件、测试参数文件和并行节点配置文件;
b) 使用MPI 命令运行偏移成像测试软件。
7.5.3 测试结果数据获取
获取测试结果数据的方法如下:
a) 常规处理测试:在作业管理界面上获取测试作业运行时长;
b) 偏移成像测试:在作业日志中获取测试作业运行时长。
测试结果数据处理
T/CCUA 049—2025
6
将测试结果数据与应用测试结果数据库中对应测试项目的测试结果进行比对,给出测试结果所处
位次。
8 测试报告
测试报告的编写内容见附录G。
T/CCUA 049—2025
7
A
A
附录A
(资料性)
节点硬盘IO 性能测试
A.1 测试准备
使用系统dd命令将测试硬盘满覆盖写至少2次。
A.2 测试工具
IO性能基准测试软件。
A.3 软件下载
按如下步骤操作:
a) 通过https://web.git.kernel.org/pub/scm/linux/kernel/git/axboe/fio.git 网址,下载
FIO-版本号.tar.gz 文件;
b) 执行tar zxvf fio-版本号.tar.gz 命令,获得Linux 操作系统上运行的FIO 软件。
A.4 测试
A.4.1 参数说明
参数说明如下:
a) filename=/dev/sda 指定测试硬盘
b) direct=1 不使用内存buffer
c) bs=128K 单次io 的块文件大小为128k
d) rw=read 或write 顺序读或写,默认顺序读
e) thread 指定创建线程为POSIX 线程
f) numjobs=4 测试线程数为4
g) size=800G 测试文件大小为800GB,也可选择更大的文件
h) iodepth=32 指定IO 队列深度,默认为1
i) ioengine=psync 使用psync IO 引擎,也可选择操作系统支持的其他IO 引擎
j) group_reporting 指定多线程汇总输出
A.4.2 测试执行
fio -filename=/dev/nvme0n1 -direct=1 -iodepth 32 -thread -rw=write -ioengine=psync -
bs=128k -size=800G -numjobs=4 -group_reporting,汇总输出如下测试信息:
fio-3.26
Starting 4 threads
Jobs: 1 (f=1): [W(1),_(3)][99.9%][w=1477MiB/s][w=11.8k IOPS][eta 00m:02s]
seq_2xwrite_128k: (groupid=0, jobs=4): err= 0: pid=10091: Mon Apr 19 12:42:27 2021
write: IOPS=13.1k, BW=1641MiB/s (1721MB/s)(3200GiB/1996490msec); 0 zone resets
clat (usec): min=42, max=31670, avg=301.64, stdev=647.32
lat (usec): min=43, max=31672, avg=303.46, stdev=647.33
clat percentiles (usec):
| 1.00th=[ 65], 5.00th=[ 76], 10.00th=[ 81], 20.00th=[ 86],
| 30.00th=[ 92], 40.00th=[ 101], 50.00th=[ 113], 60.00th=[ 126],
| 70.00th=[ 147], 80.00th=[ 202], 90.00th=[ 437], 95.00th=[ 1713],
| 99.00th=[ 3687], 99.50th=[ 4047], 99.90th=[ 4293], 99.95th=[ 5604],
| 99.99th=[ 8291]
bw ( MiB/s): min= 1337, max= 3533, per=100.00%, avg=1645.32, stdev=87.56,
samples=15928
iops : min=10702, max=28268, avg=13162.54, stdev=700.52, samples=15928
lat (usec) : 50=0.07%, 100=39.16%, 250=44.55%, 500=7.48%, 750=1.23%
lat (usec) : 1000=0.56%
lat (msec) : 2=2.85%, 4=3.47%, 10=0.63%, 20=0.01%, 50=0.01%
T/CCUA 049—2025
8
cpu : usr=0.77%, sys=0.92%, ctx=26214460, majf=0, minf=1707
IO depths : 1=100.0%, 2=0.0%, 4=0.0%, 8=0.0%, 16=0.0%, 32=0.0%, >=64=0.0%
submit : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
complete : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
issued rwts: total=0,26214400,0,0 short=0,0,0,0 dropped=0,0,0,0
latency : target=0, window=0, percentile=100.00%, depth=32
Run status group 0 (all jobs):
WRITE: bw=1641MiB/s (1721MB/s), 1641MiB/s-1641MiB/s (1721MB/s-1721MB/s), io=3200GiB
(3436GB), run=1996490-1996490msec
Disk stats (read/write):
nvme0n1: ios=194/26213375, merge=0/0, ticks=40/7808689, in_queue=3594186,
util=100.00%
A.5 测试结果数据获取
输出信息中“BW=1641MiB/s”为测试结果数据。
T/CCUA 049—2025
9
B
B
附录B
(资料性)
节点内存性能测试
B.1 测试系统要求
测试时系统应启动到单用户模式,关闭除irqbalance和messagebus之外的系统服务进程,节省系统
资源。
B.2 测试工具
内存性能基准测试软件。
B.3 软件下载与编译
按如下步骤操作:
a) 通过http://www.nersc.gov/users/computational-systems/cori/nersc-8-procurement/
trinity-nersc-8-rfp/nersc-8-trinity-benchmarks/stream/ 网址,下载源程序stream.tar;
b) 执行tar xvf stream.tar 命令,解压stream.tar;
c) 执行cd stream 命令,进入文件目录,使用多线程编译命令gcc -mtune=native -march=native
-O3 -mcmodel=medium -fopenmp -DSTREAM_ARRAY_SIZE=200000000 -DNTIMES=30 stream.c
-o stream.o,其中DSTREAM_ARRAY_SIZE 选项指定数组大小参数N,DNTIMES 选项指定测试执
行次数,并从这些测试结果中选最优测试值,生成使用程序stream_c.exe。
B.4 测试执行
stream_c.exe,输出如下测试信息:
STREAM version $Revision:5.9 $
This system uses 8 bytes per DOUBLE PRECISION word.
Array size = 20000000, Offser = 0
Total memory required = 457.MB.
Each test is run 10 times, but only
the *best* time for each is used.
Printing one line per active thread ....
Your clock granularity/precision appears to be 1 microseconds.
Each test below will take on the order of 17052 microseconds.
(= 17052 clock ticks)
Increase the size of the array if this shows that
You are not getting at least 20 clock ticks per test.
WARNING -- The above is only a rough guideline.
For best results, please bu sure you know the
precision of your system timer.
Function Rate(MB/s) Avg time Min time Max time
Copy: 12109.2511 0.0264 0.0264 0.0265
Scale: 12038.6521 0.0266 0.0266 0.0267
Add: 13539.8402 0.0355 0.0355 0.0356
Triad: 13504.4298 0.0356 0.0355 0.0357
B.5 测试结果数据获取
输出信息中“Function”和“Rate”列分别对应Stream的四个基本测试功能及测试结果数据。
T/CCUA 049—2025
10
C
C
附录C
(资料性)
网络性能测试
C.1 基础软件
MPI软件。
C.2 测试工具
网络性能基准测试软件。
C.3 软件下载与编译
按如下步骤操作:
a) 通过http://mvapich.cse.ohio-state.edu/benchmarks/ 网址下载源程序 osu-microbenchmarks-
5.6.3.tar 文件;
b) 执行tar zxvf osu-micro-benchmarks-5.6.3.tar.gz 命令,解压tar 文件;
c) 执行cd osu-micro-benchmarks-5.6.3 命令,进入文件目录;
d) 顺序执行./configure、make -j 16 和make install 命令,完成网络基准测试软件的配置、
编译和安装。
C.4 测试执行
C.4.1 MPI带宽测试
mpirun -np 2 --host , ./osu_bw,输出如下测试结果:
# OSU MPI Bandwidth Test v5.6.3
# Size Bandwidth(MB/s)
1 0.45
2 0.92
4 2.38
8 5.97
16 11.84
32 24.95
64 29.86
128 58.68
256 120.16
512 221.25
1024 473.30
2048 882.63
4096 1340.65
8192 1751.90
16384 1931.95
32768 2044.61
65536 2036.11
131072 2039.09
262144 2064.89
524288 1977.29
1048576 1963.61
2097152 1976.19
4194304 1927.27
C.4.2 MPI延时测试
mpirun -np 2 --host , ./osu_latency,输出如下测试结果:
# OSU MPI Latency Test v5.6.3
# Size Latency(us)
T/CCUA 049—2025
11
0 13.09
1 16.78
2 17.09
4 17.14
8 16.93
16 16.80
32 16.77
64 16.92
128 17.05
256 17.67
512 17.42
1024 17.99
2048 19.78
4096 22.12
8192 47.44
16384 60.26
32768 59.88
65536 109.65
131072 148.70
262144 292.45
524288 433.47
1048576 682.49
2097152 1187.85
4194304 2191.51
C.5 测试结果数据获取
输出信息中取数值“4096”对应行的测试数值1340.65MB/s和22.12us为网络带宽和延迟的测试结果
数据。
T/CCUA 049—2025
12
D
D
附录D
(资料性)
存储性能测试
D.1 基础软件
MPI软件。
D.2 测试工具
存储性能基准测试软件。
D.3 下载与编译
按如下步骤操作:
a) 执行git clone https://github.com/IO500/io500.git -b io500-isc22 命令,获取源程序
镜像;
b) 执行cd io500 命令,进入文件目录;
c) 执行./prepare.sh 命令,安装准备;
d) 执行make 命令,编译生成执行程序。
D.4 测试
D.4.1 测试参数调整
调整np和config-minimal.ini模板文件中blocksize参数。
D.4.2 测试执行
mpiexec -np 2 ./io500 config-minimal.ini,输出如下测试信息:
[RESULT] BW phase 1 ior_easy_write 6.021 GiB/s : time 35.83 seconds
[RESULT] BW phase 2 ior_hard_write 0.068 GiB/s : time 43.69 seconds
[RESULT] BW phase 3 ior_easy_read 5.144 GiB/s : time 46.86 seconds
[RESULT] BW phase 4 ior_hard_read 0.219 GiB/s : time 13.52 seconds
[RESULT] IOPS phase 1 mdtest_easy_write 10.334 kiops : time 32.09 seconds
[RESULT] IOPS phase 2 mdtest_hard_write 5.509 kiops : time 45.68 seconds
[RESULT] IOPS phase 3 find 123.770 kiops : time 4.71 seconds
[RESULT] IOPS phase 4 mdtest_easy_stat 31.086 kiops : time 10.67 seconds
[RESULT] IOPS phase 5 mdtest_hard_stat 0.733 kiops : time 8.19 seconds
[RESULT] IOPS phase 6 mdtest_easy_delete 4.868 kiops : time 68.13 seconds
[RESULT] IOPS phase 7 mdtest_hard_read 5.734 kiops : time 43.88 seconds
[RESULT] IOPS phase 8 mdtest_hard_delete 3.443 kiops : time 75.07 seconds
[SCORE] Bandwidth 0.822726 GiB/s : IOPS 12.6286 kiops : TOTAL 3.22333
D.5 测试结果数据获取
输出信息中“ior_easy_write”和“ior_easy_read”行分别对应的6.021 GiB/s和5.144 GiB/s为
存储大文件顺序写与读性能的测试结果数据。
T/CCUA 049—2025
13
E
E
附录E
(资料性)
整体性能测试
E.1 基础软件和数学库
MPI软件、BLAS库和基本线性代数库。
E.2 测试工具
整体计算性能基准测试软件。
E.3 下载与编译
按如下步骤操作:
a) 通过www.netlib.org/benchmark/hpl 网站下载HPL 源代码包hpl.tar.gz;
b) 执行tar –xzvf hpl.tar.gz 命令,解压tar 文件;
c) 执行cd hpl 命令,进入文件目录;
d) 执行cp setup/Make.Linux_PII_FBLAS Make.test 命令,拷贝Make 模板文件生成Make 文件;
e) 根据测试环境配置,修改Make.test 文件中变量;
f) 执行make arch=test 命令,编译在hpl/bin/test 目录下生成可执行文件xhpl 和配置文件
HPL.dat。
E.4 测试
E.4.1 并行环境配置
编辑并行节点进程配置文件nodefile。
E.4.2 测试参数调整
调整HPL.dat文件中相关参数。
E.4.3 测试执行
mpirun –p4pg nodefile xhpl,输出如下测试信息:
============================================================================
T/V N NB P Q Time Gflops
----------------------------------------------------------------------------
WC23C2C4 728480 232 32 80 31972.21 8.061e+03
----------------------------------------------------------------------------
||Ax-b||_oo / ( eps * ||A||_1 * N ) = 0.0028792 ...... PASSED
||Ax-b||_oo / ( eps * ||A||_1 * ||x||_1 ) = 0.0015927 ...... PASSED
||Ax-b||_oo / ( eps * ||A||_oo * ||x||_oo ) = 0.0002556 ...... PASSED
============================================================================
E.5 测试结果数据获取
输出信息中“Gflops”和“8.061e+03”表示测试结果数据为8.061×103Gflops。
T/CCUA 049—2025
14
F
F
附录F
(规范性)
应用测试数据
F.1 常规处理测试数据
炮集数据应符合表F.1的规定。
表F.1 炮集测试数据
数据属性 数值 单位
炮数 5500 炮
道数 4349700 道
采样间隔 2 ms
记录长度 6 s
数据大小 50 GB
CMP道集数据应符合表F.2的规定。
表F.2 CMP 道集测试数据
数据属性 数值 单位
线数 34 条
道数 2014529 道
CNP数 843 个
覆盖次数 428 次
采样间隔 2 ms
记录长度 7 s
数据大小 26.9 GB
F.2 叠前时间偏移测试数据
叠前时间偏移测试数据应符合表F.3的规定。
表F.3 叠前时间偏移测试数据
数据属性 数值 单位
线数 840 条
道数 170835240 道
面元网格 ≤25×25 m
采样间隔 2 ms
记录长度 8 s
数据大小 2.5 TB
F.3 叠前深度偏移测试数据
叠前深度偏移测试数据应符合表F.4的规定。
表F.4 叠前深度偏移测试数据
数据属性 数值 单位
线数 1400 条
道数 23104089 道
采样间隔 2 ms
T/CCUA 049—2025
15
表F.4 叠前深度偏移测试数据(续)
数据属性 数值 单位
记录长度 7 s
数据大小 301 GB
F.4 逆时偏移测试数据
逆时偏移测试数据应符合表F.5的规定。
表F.5 逆时偏移测试数据
数据属性 数值 单位
炮数 22932 炮
道数 114660000 道
面元网格 ≤25×25 m
模型网格 876(X)× 1001(Y)× 1501(Z) 个
F.5 全波形反演测试数据
全波形反演测试数据应符合表F.6的规定。
表F.6 全波形反演测试数据
数据属性 数值 单位
炮数 20000 炮
道数 100000000 道
面元网格 ≤25×25 m
模型网格 801(X)× 101(Y)× 187
(Z)
个
T/CCUA 049—2025
16
G
G
附录G
(资料性)
测试报告内容
G.1 引言
说明测试的时间、地点、组织方和测试目的等。
G.2 测试系统配置
G.2.1 集群计算节点配置
说明测试计算节点的硬件配置,内容包括CPU/GPU个数、内存、内置硬盘、网卡、PCIe插槽等型号、
数量和性能参数,以及集群节点数量。
G.2.2 集群网络配置
包括但不限于以下内容:交换机型号、数量、交换架构、总体性能、端口数量等性能参数及其软件
版本与配置;计算节点或存储网卡、驱动软件版本及链路配置模式等;集群网络拓扑和组网方式及协议。
G.2.3 集群存储配置
内容包括存储节点型号、数量与容量,以及存储节点CPU与内存的数量、型号和性能参数,硬盘的
数量、型号和性能参数,内部网络拓扑与网络协议、连接端口数量与性能参数,对外网络连接端口数量
与网络协议,文件系统类型与部署方式等。
G.2.4 系统软件配置
内容包括操作系统、应用开发环境、并行环境、需要的支持库和编译器等,以及文件系统、数据库
的类型与版本。
G.3 系统性能测试
G.3.1 单项测试
G.3.1.1 节点硬盘IO 性能测试
内容包括测试软件及版本,测试命令、输出测试信息及测试结果数据等。
G.3.1.2 节点内存性能测试
内容包括CPU型号和三级缓存总容量,测试软件及版本,测试命令、输出测试信息及测试结果数据
等。
G.3.1.3 网络性能测试
内容包括测试软件及版本,测试命令、输出测试信息及测试结果数据。
G.3.1.4 存储性能测试
内容包括测试客户端节点数,测试软件及版本,测试命令、输出测试信息及测试结果数据。
G.3.2 整体计算性能测试
内容包括测试软件及版本,测试命令、输出测试信息及测试结果数据。
G.3.3 测试结果数据处理
G.3.3.1 单项性能测试结果数据处理
内容包括测试结果数据处理过程及处理结果。
T/CCUA 049—2025
17
G.3.3.2 整体计算性能测试结果数据处理
内容包括测试结果数据处理过程及处理结果。
G.4 应用性能测试
G.4.1 常规处理
G.4.1.1 内存容量敏感型
内容包括测试软件及版本、测试数据、测试参数、作业参数及测试结果数据。
G.4.1.2 内置临时盘敏感型
内容包括测试软件及版本、测试数据、测试参数、作业参数及测试结果数据。
G.4.1.3 计算与大内存敏感型
内容包括测试软件及版本、测试数据、测试参数、并行作业参数、网络协议及测试结果数据。
G.4.2 偏移成像
G.4.2.1 Kirchhoff 叠前时间偏移
内容包括测试软件及版本、测试数据、测试参数、并行作业参数、网络协议及测试结果数据。
G.4.2.2 Kirchhoff 叠前深度偏移
内容包括测试软件及版本、测试数据、测试参数、并行作业参数、网络协议及测试结果数据。
G.4.2.3 逆时偏移成像
G.4.2.3.1 1 个节点测试
内容包括测试软件及版本、测试数据、测试参数及测试结果数据。
G.4.2.3.2 全部节点测试
内容包括测试软件及版本、测试数据、测试参数,测试节点数、网络协议及测试结果数据。
G.4.2.4 全波形反演
G.4.2.4.1 1 个节点测试
内容包括测试软件及版本、测试数据、测试参数及测试结果数据。
G.4.2.4.2 全部节点测试
内容包括测试软件及版本、测试数据、测试参数,测试节点数、网络协议及测试结果数据。
G.4.3 测试结果数据处理
G.4.3.1 1 个节点或10 个节点测试结果数据处理
内容包括测试结果数据处理过程及处理结果。
G.4.3.2 全部计算节点测试数据处理
内容包括测试结果数据处理过程及处理结果。
G.5 测试结论
T/CCUA 049—2025
18
分析各项测试结果数据的处理结果,给出集群应用计算性能结论以及可改进优化的建议。
T/CCUA 049—2025
19
参考文献
[1] SY/T 7615-2021 陆上纵波地震勘探资料处理技术规程
[2] 地球物理学名词审定委员会.《地球物理学名词》[M].北京:科学出版社,2022
[3] 计算机科学技术名词审定委员会.《计算机科学技术名词》[M].北京:科学出版社,2018
[4] Oz Yilmaz.《Seismic Data Analysis》[M].SEG出版社,2001
评论