团 体 标 准
T/TAF 292—2025
面向交易场景的算力资源度量指标体系及
测试方法
Measurement metric system and testing method for transaction oriented
computational power resources
2025-07-07 发布 2025-07-07 实施
电信终端产业协会 发布
前 言
本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起草。
本文件中的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由电信终端产业协会(TAF)提出并归口。
本文件起草单位:中国信息通信研究院、工信部北京互联网交换中心、郑州大学、武汉光谷爱计算有限公司、山西太行实验室有限公司、中国人民解放军61932部队、上海通贸国际供应链管理有限公司、青岛国实科技集团有限公司、无锡先进技术研究院、北京趋动智能科技有限公司、辽宁通信行业职业技能鉴定中心、中移(苏州)软件技术有限公司、中移动信息技术有限公司、烽火通信科技股份有限公司、北京京东世纪贸易有限公司、武汉网锐检测科技有限公司、成都泰瑞通信设备检测有限公司、北京信而泰科技股份有限公司。
本文件主要起草人:田利彬、李然、赵庆、于哲、张宏巍、王成锐、钱艳、吴金明、杨菠、胡建平、姚紫健、陈虎、刘桐、汤昊、许旋、蔡维康、宋威、郭西风、葛立军、门维乙、杨晋、孙维亚、肖恩涛、田怿民、肖势川、武强、韩东、郑佳、陆宬宸、汤紫棋、李佳辉、刘洋、张晓丽、孟庆磊、刘海楠、吴磊、宋群、于若桐、刘雅东、张飏、李震、孙亚琦、苑斌斌、李启明、杨天燚。
面向交易场景的算力资源度量指标体系及测试方法
1 范围
本文件规定了面向交易场景的算力资源度量指标体系及测试方法。
本文件适用于面向交易场景下算力中心的算力资源,度量资源性能、功能质量、信息安全性、可靠性、易用性等指标。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 43331—2023 互联网数据中心(IDC)技术和分级要求
YD/T 993—2016 有线电信终端设备防雷技术要求及试验方法
YD/T 1429—2024 通信局(站)在用防雷系统的技术要求和检测方法
3 术语和定义
下列术语和定义适用于本文件。
3.1
算力 computational power
算力中心的服务器通过对数据进行处理后实现结果输出的一种能力。
注:算力单位可为FLOPS。
[来源: GB/T 43331—2023 3.9,有修改]
3.2
算力资源 computational power resources
用于计算和处理任务的软硬件资源。
3.3
交付算力 delivery computational power
已交付用户的算力。
3.4
使用算力 in use computational power
已交付用户且用户实际使用的算力。
3.5
算力填充率 computational power filling rate
交付算力占算力总量的比率。
3.6
算力使用率 computational power utilization rate
使用算力占算力总量的比率。
3.7
人工智能算力 artificial intelligence computational power
面向人工智能应用提供的算力。
3.8
人工智能算力占比 artificial intelligence computational power share人工智能算力占算力总量的比率。
3.9
存储备份覆盖率 storage backup coverage rate
用于备份数据的存储容量占存储总容量的比率。
3.10
新计算资源占比 proportion of new computational power resources
算力资源因扩容等原因,近一年内的算力增量占算力总量的比率。
3.11
新存储资源占比 proportion of new storage resources
算力资源因扩容等原因,近一年内存储容量增量占存储总容量的比率。
3.12
交易场景 business transaction scenario
涵盖购买、租赁等商业交易活动的业务场景。
3.13
供方资源 supplier resources
供应侧可供交易的算力资源。
3.14
需方资源 demander resources
需求侧用户通过交易获取的算力资源。
4 缩略语
下列缩略语适用于本文件。
FLOPS:每秒浮点运算次数(floating point operations per second)
FP:浮点(floating point)
GB:千兆字节(gigabyte)
INT:整数(integer)
IOPS:每秒输入/输出操作次数(input/output operations per second)
MB/S:每秒兆字节(megabytes per second)
P:数量级前缀,指千万亿(peta -)
TPS:每秒事务数(transactions per second)
5 度量指标及要求
从算力资源交易场景出发,将度量指标分为通用指标、供应侧指标和需求侧指标三类,指标见图1。
图1 面向交易场景的算力资源度量指标体系
5.1 通用指标及要求
5.1.1 算量
5.1.1.1 量值
量值指标如下:
a) 算力总量:算力资源的理论算力总量;
b) 磁盘总容量:算力资源的磁盘总容量;
c) 内存总容量:算力资源的内存总容量;
d) 显存总容量:算力资源的显存总容量。
5.1.2 功能质量
5.1.2.1 用户管理
应具备用户管理功能,如用户添加、用户更新、用户查询、用户删除、用户注册、用户登录、创建子账户、管理子账户等功能。
5.1.2.2 作业管理
应具备作业管理功能,如作业提交、作业挂起、作业恢复、作业终止、作业统计、查看作业任务等功能。
5.1.2.3 资源管理
应具备资源管理功能,如资源开通、资源扩容、资源缩容、资源监控等功能。
5.1.2.4 工单管理
应具备工单管理功能,如工单创建、工单处理、工单查询、工单通知等功能。
5.1.2.5 账单管理
应具备账单管理功能,如账单查询、账单明细等功能。
5.1.3 信息安全性
5.1.3.1 权限管理
应具备权限管理功能,如用户认证、用户权限管理、子账户权限管理等功能。
5.1.3.2 数据安全管理
应具备数据安全管理功能,如重要数据存储加密,数据备份,数据恢复等功能。
5.1.3.3 日志管理
应具备日志管理功能,如系统日志管理、操作日志管理等功能。
5.1.4 可靠性
5.1.4.1 系统可靠性
应具备系统可靠性,即在规定的条件下和规定的时间内,完成规定功能的能力,如7*24小时不间断运行。
5.1.5 易用性
5.1.5.1 易辨识性
应具备易辨识性,如用户能否通过界面、菜单、输入框等理解系统的具体功能。
5.1.5.2 易学性
应具备易学性,如是否易于用户学习使用,指导用户操作。如有无配备用户手册、帮助文档、视频教程等学习资源。
5.1.5.3 用户差错防御性
应具备用户差错防御性,如是否具备预防用户犯错的功能,如是否具备在导致系统数据发生变化的操作执行之前 (如删除操作),系统明确提示用户确认。
5.2 供应侧指标及要求
5.2.1 算量
5.2.1.1 量值
量值指标如下:
a) 交付算力:供方资源的交付算力;
b) 使用算力:供方资源的使用算力。
5.2.1.2 占比
占比指标如下:
a) 算力填充率:供方资源的算力填充率;
b) 算力使用率:供方资源的算力使用率;
c) 人工智能算力占比:供方资源的人工智能算力占比;
d) 新计算资源占比:供方资源的新计算资源占比;
e) 新存储资源占比:供方资源的新存储资源占比;
f) 存储备份覆盖率:供方资源的存储备份覆盖率。
5.2.2 可靠性
5.2.2.1 防雷安全可靠性
防雷安全可靠性指标及要求如下:
a) 基础设施防雷安全可靠性:各类算力中心、计算机机房等基础设施,应满足YD/T 1429—2024第5章要求;
b) 电信设备端口过电压过电流抗力:各类算力服务器、网络设备等电信设备端口抗力,应满足YD/T 993—2016 5.3章节要求。
5.3 需求侧指标
5.3.1 算量
5.3.1.1 负载率
负载率指标如下:
a) 算力负载率:需方资源中预装软件已用算力占需方资源总算力的比率;
b) 存储负载率:需方资源中预装软件已用存储容量占需方资源总存储容量的比率;
c) 内存负载率:需方资源中预装软件已用内存容量占需方资源总内存容量的比率;
d) 显存负载率:需方资源中预装软件已用显存容量占需方资源总显存容量的比率。
5.3.2 性能
5.3.2.1 公网
公网性能指标如下:
a) 带宽:需方资源每秒经公网传输数据量的平均值;
b) 时延:需方资源经公网传输数据时,数据从发送端发出到接收端接收到的平均耗时;
c) 丢包率:需方资源经公网传输数据,数据从发送端发出到接收端接收到,丢失数据量相较于总发送数据量的平均占比;
d) 延迟抖动:需方资源经公网传输数据,数据传输延迟变化的平均程度。
5.3.2.2 内网
内网性能指标如下:
a) 带宽:需方资源每秒经内网传输数据量的平均值;
b) 时延:需方资源经内网传输数据时,数据从发送端发出到接收端接收到的平均耗时;
c) 丢包率:需方资源经内网传输数据,数据从发送端发出到接收端接收到,丢失数据量相较于总发送数据量的平均占比;
d) 延迟抖动:需方资源经内网传输数据,数据传输延迟变化的平均程度。
5.3.2.3 磁盘
磁盘性能指标如下:
a) IOPS:需方资源中磁盘每秒完成的读/写操作平均次数;
b) 时延:需方资源中磁盘完成一次读写操作的平均耗时;
c) 吞吐量:需方资源中磁盘每秒成功传输数据量的平均值。
5.3.2.4 内存
内存性能指标如下:
a) 吞吐量:需方资源中内存每秒成功传输数据量的平均值;
b) 时延:需方资源中内存完成传输数据所经历的平均耗时。
5.3.2.5 显存
显存带宽:显存带宽平均值。
5.3.2.6 系统
系统性能指标如下:
a) TPS:系统平均TPS;
b) 响应时间:系统平均响应时间;
c) 吞吐量:系统平均吞吐量。
6 测试方法
6.1 通用指标测试方法
6.1.1 算量
6.1.1.1 量值
量值指标测试方法如下:
a) 算力总量:针对特定数值类型及精度(如INT8、FP16、FP32等)规格,首先检测单设备数值运算性能峰值,计算方法如公式(1);后将所有设备算力值进行累加,得到特定数值类型及精度对应的算力总量并记录。记录格式应为算力总量值@数值精度(如10P@INT8、60P@FP16等);
注:当算力资源对应多种数值类型与精度规格时,应依据不同的数值类型及精度,独立核算对应的算力总量,分别展示各精度下的计算值,不进行跨类型、跨精度求和。
RPeak = hz × n × c (1)
式中:
Reak ——数值运算性能峰值;
hz ——频率,即最大运行频率,单位为GHz;
n ——每个时钟周期执行数值运算次数,是指每个时钟周期能完成的数值运算次数;
c ——设备的核心数量,核心数量为能进行数值运算的核心数;
b) 磁盘总容量:检测算力资源中每个设备的磁盘容量并累加,得到磁盘总容量并记录;
c) 内存总容量:检测算力资源中每个设备的内存容量并累加,得到内存容量并记录;
d) 显存总容量:检测算力资源中每个设备的显存容量并累加,得到显存总容量并记录。
6.1.2 功能质量
6.1.2.1 用户管理
模拟用户使用,检测是否具备用户管理功能。
6.1.2.2 作业管理
模拟用户使用,检测是否具备作业管理功能。
6.1.2.3 资源管理
模拟用户使用,检测是否具备资源管理功能。
6.1.2.4 工单管理
模拟用户使用,检测是否具备工单管理功能。
6.1.2.5 账单管理
模拟用户使用,检测是否具备账单管理功能。
6.1.3 信息安全性
6.1.3.1 权限管理
模拟用户使用,检测是否具备权限管理功能。
6.1.3.2 数据安全管理
模拟用户使用,检测是否具备数据安全管理功能。
6.1.3.3 日志管理
模拟用户使用,检测是否具备日志管理功能。
6.1.4 可靠性
6.1.4.1 系统可靠性
使用工具模拟用户使用,检测算力资源系统可靠性。
6.1.5 易用性
6.1.5.1 易辨识性
模拟用户使用,检测用户能否通过界面、菜单、输入框等理解系统的具体功能。
6.1.5.2 易学性
模拟用户使用,系统是否易于用户学习使用,指导用户操作。如有无配备用户手册、帮助文档、视频教程等学习资源。
6.1.5.3 用户差错防御性
模拟用户使用,系统是否具备预防用户犯错的功能,如是否具备在导致系统数据发生变化的操作执行之前 (如删除操作),系统明确提示用户确认。
6.2 供应侧指标测试方法
6.2.1 算量
6.2.1.1 量值
量值指标测试方法如下:
a) 交付算力:检测算力平台的算力服务合约、账单等记录数据,综合计算交付算力,得到交付算力并记录;
b) 使用算力:检测算力平台的算力服务合约、账单等记录数据,综合计算已交付用户且用户实际使用的算力,得到使用算力并记录。
6.2.1.2 占比
占比指标测试方法如下:
a) 算力填充率:计算供方资源交付算力占供方资源算力总量的比例,得到算力填充率并记录;
b) 算力使用率:计算供方资源使用算力占供方资源算力总量的比例,得到算力使用率并记录;
c) 人工智能算力占比:检测供方资源面向人工智能应用提供的算力总量,计算其占供方资源算力总量的比率,得到人工智能算力占比并记录;
d) 新计算资源占比:检测近一年内供方资源算力增量,计算其占供方资源算力总量的比率,得到新计算资源占比并记录;
e) 新存储资源占比:检测近一年内供方资源存储容量增量,计算其占供方资源存储总容量的比率,得到新存储资源占比并记录;
f) 存储备份覆盖率:检测供方资源用于备份数据的存储容量,计算其占供方资源存储总容量的比率,得到存储备份覆盖率并记录。
6.2.2 可靠性
6.2.2.1 防雷安全可靠性
防雷安全可靠性指标测试方法如下:
a) 基础设施防雷安全可靠性:各类算力中心、计算机机房等基础设施的测试方法,参考YD/T 1429
—2024第6章;
b) 电信设备端口过电压过电流抗力:各类算力服务器、网络设备等电信设备端口抗力的测试方法,参考YD/T 993—2016 6.3章节。
6.3 需求侧指标测试方法
6.3.1 算量
6.3.1.1 负载率
负载率指标测试方法如下:
a) 算力负载率:检测需方资源算力负载率并记录;
b) 存储负载率:检测需方资源存储负载率并记录;
c) 内存负载率:检测需方资源内存负载率并记录;
d) 显存负载率:检测需方资源显存负载率并记录。
6.3.2 性能
6.3.2.1 公网
公网指标测试方法如下:
a) 带宽:检测需方资源在一定长度时间内,经公网传输数据的平均带宽并记录;
b) 时延:检测需方资源在一定长度时间内,经公网传输数据的平均时延并记录;
c) 丢包率:检测需方资源在一定长度时间内,经公网传输数据的平均丢包率并记录;
d) 延迟抖动:检测需方资源在一定长度时间内,经公网传输数据的延迟时间变化平均值并记录。
6.3.2.2 内网
内网指标测试方法如下:
a) 带宽:检测需方资源在一定长度时间内,经内网传输数据的平均带宽并记录;
b) 时延:检测需方资源在一定长度时间内,经内网传输数据的平均时延并记录;
c) 丢包率:检测需方资源在一定长度时间内,经内网传输数据的平均丢包率并记录;
d) 延迟抖动:检测需方资源在一定长度时间内,经内网传输数据的延迟时间变化平均值并记录。
6.3.2.3 磁盘
磁盘指标测试方法如下:
a) IOPS:检测需方资源在一定长度时间内的磁盘IOPS平均值并记录;
b) 时延:检测需方资源在一定长度时间内的磁盘时延平均值并记录;
c) 吞吐量:检测需方资源在一定长度时间内的磁盘吞吐量平均值并记录。
6.3.2.4 内存
内存指标测试方法如下:
a) 吞吐量:检测需方资源在一定长度时间内的内存吞吐量平均值并记录;
b) 时延:检测需方资源在一定长度时间内的内存时延平均值并记录。
6.3.2.5 显存
带宽:检测需方资源在一定长度时间内的显存带宽平均值并记录。
6.3.2.6 系统
系统指标测试方法如下:
a) TPS:检测需方资源在一定长度时间内的系统TPS平均值并记录;
b) 响应时间:检测需方资源在一定长度时间内的系统响应时间平均值并记录;
c) 吞吐量:检测需方资源在一定长度时间内的系统吞吐量平均值并记录。
7 测试环境及工具要求
7.1 测试环境要求
7.1.1 通用度量指标测试环境要求
测试环境要求如下:
a) 应明确算力资源度量对象粒度;如设备、节点、算力平台等;
b) 应准确提供算力中心在用的所有算力资源设备规格信息,如设备数量、设备型号、芯片数量、芯片型号等;
c) 上述2项要求中提及的算力资源设备、芯片规格信息等数据,应为结构化数据;
d) 应能部署算力资源度量检测工具;
e) 应确认功能质量检测范围,如用户管理、作业管理、资源管理、工单管理、账单管理等,并提供测试环境;
h) 应确认信息安全性检测范围,如权限管理、数据安全、日志管理等,并提供测试环境;
i) 应提供可靠性检测环境,如检测实施所需的机器(如虚拟机)、接口信息、系统数据等;
j) 应提供易用性测试环境。
7.1.2 供给侧度量指标测试环境要求
测试环境要求如下:
a) 应准确提供已交付用户的算力资源清单数据,如账单、服务合约等;
b) 应准确提供用户实际使用的算力资源清单数据,如账单、日志、服务合约等;
c) 上述2项要求中提及的算力资源清单数据,应为结构化数据;
d) 应准确提供人工智能算力、新计算资源、新存储资源、存储备份等相关数据,宜提供对应佐证材料。
7.1.3 需求侧度量指标测试环境要求
应能部署算力资源度量检测工具,如网络、磁盘、内存等资源性能检测工具等。
7.2 测试工具要求
应同时支持资源性能、可靠性等指标度量检测功能。

评论