团 体 标 准
T/TAF 298—2025
x86 云游戏服务器技术要求
Technical requirements of x86 cloud gaming servers
2025-07-07 发布 2025-07-07 实施
电信终端产业协会 发布
前 言
本文件按照 GB/T 1.1-2020《标准化工作导则 第 1 部分:标准化文件的结构和起草规则》的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由电信终端产业协会(TAF)提出并归口。
本文件起草单位:硅基大陆(成都)科技有限公司、中国信息通信研究院、中国移动通信集团终端有限公司、启朔(深圳)科技有限公司、深圳云天畅想信息科技有限公司、安徽海马云科技股份有限公司、北京庭宇科技有限公司。
本文件主要起草人:周维、 乔峙、穆琳、李鑫、林瑞杰、曾晨曦、国辰、邱晓敏、支彬、陈卓杰、陈雷、陶清乾、李兆明、杨文溢。
x86 云游戏服务器技术要求
1 范围
本文件规定了用于云游戏场景的 x86 服务器的整机结构、整机散热、整机供电、计算节点、计算用主板、服务器整机管理、可维护性需求等技术要求。本规范综合考虑了云游戏服务器在成本、性能和管理等方面的要求。
本文件适用于云游戏服务器开发设计、云游戏服务提供者、云游戏服务器机房管理方等参考使用。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 19520.16—2015 电子设备机械结构 482.6 mm(19 in)系列机械接口尺寸 第16部分:小
型化插箱和插件的尺寸
GY/T 396—2023 云游戏总体技术要求
IEC 60950 信息技术设备 安全 (Information Technology Equipment - Safety)
3 术语和定义
下列术语和定义适用于本文件。
3.1
云游戏 cloud gaming
参考GY/T 396—2023 云游戏总体技术要求,3.1节。
3.2
数据中心 data center
由计算机场地、配套基础设施、信息系统硬件 (物理和虚拟资源)、信息系统软件、信息资源 (数据)
和人员以及相应的规章制度组成的组织。
4 缩略语
下列缩略语适用于本文件。
AC:交流电(Alternating Current)
ATX:ATX结构标准(Advanced Technology Extended)
BIOS:基本输入输出系统(Basic Input Output System)
BMC:基板管理控制器(Basedboard Management Controller)
CPLD:复杂可编程逻辑器件(Complex Programming Logic Device)
CPU:中央处理器(Central Processing Unit)
CRPS:通用冗余电源(Common Redundant Power Supply)
DC:直流电(Direct Current)
DIMM:双列直插式存储模块(Dual-Inline-Memory-Modules)
DP:显示接口(Display Port)
EC:嵌入式控制器(Embedded Controller)
FRU:现场可更换单元(Field Replace Unit)
GPU:图形处理器(Graphics Processing Unit)
HDD:硬盘(Hard Disk Drive)
HDMI:高清多媒体接口(High Definition Multimedia Interface)
I2C:集成电路总线-两线式串行通信总线(Inter-Integrated Circuit)
IOPS:每秒输入输出次数(Input/Output Per Second)
LAN:局域网(Local Area Network)
NIC:网卡(Network Interface Controller)
NVME:非易失性内存主机控制器接口规范(Non-Volatile Memory Express)
OS:操作系统(Operating System)
PCle:高速串行计算机扩展总线标准(Peripheral Component Interconnect Express)
PID:比例积分微分算法(Proportion Integral Differential)
PWM:脉冲宽度调制(Pulse Width Modulation)
PSU:供电单元(Power Supply Unit)
PDU:电源分配单元(Power Distribution Unit)
PMBus:电源管理总线(Power Management Bus)
PXE:预启动执行环境(Preboot eXecution Environment)
TCO:总体拥有成本(Total Cost of Ownership)
TPM:可信平台模块(Trusted Platform Module)
TPCM:可信平台控制模块(Trusted Platform Control Module)
SSD:固态硬盘(Solid State Drive)
SAS:串行连接 SCSI(Serial Attached SCSI)
SEL:系统事件日志(System Event Log)
UID:单元识别灯(Unit Identification Light)
USB:通用串行总线(Universal Serial Bus)
UEFI:统一的可扩展固件接口 (Unified Extensible Firmware Interface)
VGA:视频图形阵列(Video Graphic Array)
5 服务器结构规范技术要求
5.1 总体要求
服务器结构尺寸设计应遵循 GB/T 19520.16—2015 第 5 章节相关尺寸规范,机箱高度以 U 为单位, 1U=1.75Inch=44.45mm。
5.2 服务器机箱尺寸规范技术要求
机箱主体深度D≤1025mm,见图1,即从机柜前方孔条到机箱尾部空间,包含但不限于机箱尾部的线缆安装支架,机箱凸起,把手等;尾部走线空间 (如电源线/信号线),含外凸连接器,深度不超过75mm,且要求不得阻挡电源分配单元(PDU)的在线拆装运维。
图 1 机箱外形尺寸示意图
机箱正面深度≤100mm,即机柜前方孔条面到机箱正面,包含但不限于机箱正面的走线空间(如电源线、信号线),机箱凸起,把手,折弯等。其中:
见图2,a)所示,后出线机箱挂耳厚度,以及机箱正面器件面可凸出机柜方孔条距离不大于100mm。
见图2,b)所示,前后出线机箱挂耳厚度,以及机箱正面器件面可凸出机柜方孔条距离不大于25mm;其它非出线器件面可凸出机柜方孔条距离不大于100mm。
机箱宽度W的范围为430mm≤W≤448mm;其中:
a) 最小尺寸430mm,不包含机箱侧面凸起特征,如销钉等;
b) 最大尺寸448mm,包含机箱侧面所有凸起特征。
机箱高度H的范围需考虑机箱下垂变形对机箱上架安装的影响,其中:
a) 1U机箱高度 H≤ 44.5 mm;机箱下垂变形小于 0.8mm;
b) 2U及以上机箱高度H≤n*U±2.8mm;机箱下垂变形小于1.5mm。
注 : 机箱高度规定为机箱上下面最大距离,机箱底面不推荐采用断差设计。
图 2 机箱深度尺寸参考图
5.3 服务器机箱外表面通风孔设计规范技术要求
机箱通风孔按照 IEC 60950 进行设计,应设计为宽度为直径 4.3mm,R 角为0.3mm 的正六边形
(4.3mm-R0.3mm)。局部不能摆放完整六边形孔的时候,通风孔统一改为4mmx2mm R 角为 0.5mm 的矩形孔。连续六边形区域,周边孔的棱线需平齐。设计要求见图 3。
图 3 六边形开孔及矩形开孔
六边形开孔与矩形开孔的相邻两个孔间隙值(Gap),应符的要求见表 1。如当钣金料厚为 0.60- 1.0mm 时,相邻两孔间隙值至少要为 1mm。当钣金料厚超过 1.5mm 时,相邻两孔间隙值为 1.5 倍料厚(即 1.5T)。
表 1 方孔开孔间隙(Gap 为 1.0 时通孔率约 66%)
6 服务器散热技术要求
6.1 总体要求
服务器整机散热应在满足关键部件的温度规格及其降额要求基础上,确保整机在典型工况下能效比最高。满足常见的数据中心机房环境要求,5℃-35℃工作环境。
6.2 服务器整机风道设计技术要求
服务器散热风道设计宜满足如下要求:
a) 系统风流方向应保持一致,如采用统一前进风后出或后进前出风设计;
b) 机箱侧面及上盖开孔需要注意在机柜中的防回流设计;系统应有防回流设计,包括硬盘、显卡、风扇、电源、网卡等部件,移除这些部件后散热设计应考虑安装对应防回流挡片;
c) 风扇墙应做好前后间密封,提高风扇能效;
d) 风扇进出风口距离一个风扇毂尺寸(Fan hub)位置不应摆放高大部件,避免挡风;
e) 风道应根据部件热量分布进行分流设计,提高冷风利用率,服务器进出风口平均温差应不低于 12℃;
f) 宜采用直通风道,避免气流转弯,气流急剧转弯的地方,应采用导风板使气流逐渐转向,使压力损失达到最小;
g) 为避免上游的热量回流到下游,影响其散热,应采用独立风道,分开散热;
h) 高功耗的元器件应靠近冷风入口或者高流速位置;
i) 导风罩设计最低要求应使用简洁易开模,避免漏风,有一定强度,固定要可靠,避免风量较大时发生变形或者位移;
j) 整机应支持环温 35℃@900m 散热能力,海拔每升高 100m,支持环温下降 0.6℃。
6.3 服务器散热器设计技术要求
服务器散热器设计宜满足如下要求:
a) 散热器应根据芯片类型设计对应固定方式及锁固力;
b) 根据不同散热器类型,应优化散热器翅片间距,保证散热器流阻和热阻的平衡;
c) 散热器应进行表面处理,通常铝挤散热器宜采用阳极处理,焊接散热器宜采用电镀处理;
d) 散热器要保证和芯片接触位置平面度和光洁度,平面度不高于0.1mm,光洁度<1.6μ m;
e) 散热器设计应有防呆设计,标签指示拆装方向及方式;
f) 面积小于3000mm² 的散热器,应用2个销钉(Pushpin)固定,反之,则应使用4个销钉固定;
g) 合理设计导热垫的压缩率,通常效率应在10%~50%之间;
h) 散热器热阻应满足芯片规格要求。
6.4 风扇设计选用技术要求
服务器风扇选型宜满足如下要求:
a) 风扇应采用服务器常用规格尺寸,如 40/60/80 规格系列等;
b) 优先选用一体式双转子风扇,避免采用相同风扇直接串联设计;
c) 风扇应具备在位侦测、转速侦测、脉冲宽度调制(PWM)调速功能;
d) 风扇宜支持热插拔设计;
e) 系统典型工况下,风扇应工作在高效率区间;
f) 风扇选型应考虑不影响机械硬盘读写性能(IOPS 指标)及整机噪音的要求;
g) 风扇笼应标注风扇序号及风流方向,且具有防呆功能;
h) 若采用单转子风扇的设计宜有防回流挡片,整机宜支持风扇 N+1 失效;
i) 风扇寿命应具备 40℃@70000h 标准;
j) 风扇转速稳定时间应低于 20s,风扇转速波动应不大于±10%;
k) 风扇选型应考虑余量,满足在高海拔(3000m)的散热需求。
6.5 风扇调速策略技术要求
服务器风扇调速策略设计宜满足如下要求:
a) 服务器整机调速策略应保证有效散热同时,典型工况下,功耗最低;
b) 主要部件应采用比例积分微分算法(PID)调速,温度快变部件(CPU、GPU 等)风扇响应时间不宜超过 3s;
c) 系统应采用设计开环(open-loop)策略,针对温度不可读器件应进行线性调速保护;
d) 服务器工作中可能出现的风扇失效、温感丢失、温感读数异常、系统固件升级、维护等特殊情况进行散热,应设计异常状况调速策略;
e) 调速策略应包括传感器阈值设定,应包括风扇全速、轻微告警、严重告警及关机等门限值;
f) 应设计分区调速,根据不同位置负载设置风扇区(fan zone)及风扇权重,降低整机功耗;
g) 风扇转速应具备联动设计,避免转速差异过大导致回流问题;
h) 风扇调速应具备稳定性,稳定负载工况下,器件温度波动不宜超过 3℃,风扇转速波动不超过规格定义值的±10%;
i) 告警设计应具备防抖机制,避免误告警;
j) 调速设计要满足噪音需求,在典型负载工况下,应满足声功率级≤72dB;
k) 温度不可读的器件应采用温感进行调速,温感要和器件温度具有一定的线性关联;
l) 系统 BMC 挂死或者异常,应采用其他控制芯片(CPLD 或者 EC 等)接管风扇调速,避免散热失控;
m) 系统进风口宜有温度传感器,温度传感器宜做冗余或者替代设计,当其失效时可采用其他传感器替代,保证系统散热正常;
n) 风扇宜支持手动调速和自动调速模式,自动调速模式建议包括节能、高性能、低噪等模式选项。
7 服务器供电技术要求
7.1 系统电源模块需求选用规格技术要求
电源模块(PSU:Power Supply Unit)可选 ATX 标准或者 CRPS-185 标准形态。CRPS-185 电源模块,宜参考 Intel 文档 ID:573090 相关章节的规范要求;ATX 电源模块,宜参考 Intel 文档 ID: 336521 相关章节的规范要求。对于云游戏服务器使用的电源基本要求如下:
a) 电源模块应支持宽电网电压 100-240VAC,47-63Hz;
b) 电源模块应同时支持 188-300VDC;
c) 电源模块均流方案宜支持 N+1/N+N 冗余(可选);
d) 电源模块主输出应为 12V 和 12Vsb,或 12V Only;
e) 电源模块滤波器宜采用≥10A 规格(接头建议选用 IEC320 C14 socket 规格);
f) 电源模块应支持 PMbus 管理功能接口(规范要求参考 PMbus 1.2);
g) 基于 PMbus 的 ON_OFF_CONFIG 命令可以控制电源模块的物理开关;
h) 电源模块应支持 AC 端的线卡,防止 AC 接头的松落;
i) 电源模块宜具备多个选择。
7.2 电源管理软件通信功能技术要求
当电源使用为标准 CRPS 电源时,硬件设计上应将电源管理总线(PMBus)信号接入带外管理(BMC)芯片,带外管理(BMC)系统通过 PMBus 协议规定的命令对电源信息进行管理和控制。当使用 ATX 电源时,无需管理功能。
a) 在此协议基础上,应实现对电源模块(PSU)相关信息查询和获取:资产信息获取、输入输出电流、输入输出电压、及输入输出电压功耗等。
b) 在电源厂商固件开放的情况下,应可通过 PMBus对电源模块进行固件更新及输出功耗、负载模式进行调节和设置。
7.3 电源模块可靠性技术要求
电源模块在环境温度为25℃、80%负载状态下,平均无故障时间(MTBF)>10 万小时。
8 服务器节点设计技术要求
8.1 面板布局规范技术要求
服务器应支持前维护或者后维护,面板上宜支持的端口和按钮要求如下:
a) 电源按键和电源指示灯:用于节点电源状态控制和指示。电源按键需内置指示灯。结构上电源按键应内凹于面板内,距离面板表面不小于 1.5mm,防止误触;
b) 服务器节点宜支持 UID 按键和 UID 指示灯,用于现场运维定位。结构上 UID 按键宜内凹于面板内,距离面板表面不小于 1.5mm,防止误触;
c) 健康指示灯:用来显示服务器节点健康状态,该指示灯宜复用电源指示灯;
d) 显示接口:用于外接显示器,根据产品规格要求宜使用 VGA/HDMI/DP 接口等;
e) USB 接口:USB 键盘和鼠标,速率宜为 USB 3.0 或 USB 2.0,数量≥2 个;
f) 管理网口:标准 RJ45 网口,速率应不低于 1Gbps,支持 10M/100M,数量 1 个;
g) 业务网口:根据产品规格要求宜使用标准 RJ45 网口或者光口,速率不低于 1Gbps。支持 PXE无盘引导、UEFI 无盘引导等。
8.2 面板指示灯参考技术要求
面板指示灯宜参考满足如下要求:
a) 指示灯颜色和波长宜符合的要求见表 2;
表 2 服务器面板指示灯颜色波长参考
b) 指示灯闪烁频率宜符合的要求见表 3;
表 3 服务器面板指示灯频率
c) 电源开关按键及指示灯行为及颜色宜符合的要求见表 4;
表 4 服务器电源开关按键及指示灯行为定义
d) 若支持 UID 开关按键及指示灯,行为及颜色宜符合的要求见表 5;
表 5 服务器 U ID 开关按键及指示灯行为定义
e) RJ45 网口指示灯行为及颜色要求。
每个 RJ45 网口有左右两个指示灯,见图4 所示。左边灯指示运行状态,右边指示连接和速度,宜符合的要求见表 6。
运行指示灯
连线/速度
指示灯
图 4 RJ45 网口指示灯位置说明
表 6 RJ45 网口指示灯行为定义
9 服务器主板设计规格技术要求
9.1 主板尺寸技术要求
采用 ATX 系列的标准尺寸,见表 7 所示。对于非标准尺寸,建议宜不超过 305x330mm。
表 7 常用 ATX 系列主板尺寸
9.2 主板内存接口设计技术要求
主板内存插槽宜满足的要求如下:
a) 内存宜采用 DIMM 插槽形式;
b) DIMM 数量应不低于 2 个插槽,建议数量为 2 个、4 个等;
c) 应支持双通道内存技术,内存频率满足 CPU 内存控制器支持的最高频率。
9.3 主板内部存储接口技术要求
主板内部存储宜满足的要求如下:
a) 在主板上宜支持 M.2;
b) 建议接口数量为 2 个 M.2 插槽;
c) 宜支持 SSD 尺寸为 2242/2280 等。
9.4 主板外部存储接口技术要求
主板外部存储接口宜满足的要求如下:
a) 通过该接口,主板宜支持使用线缆外接硬盘,支持应满足 4 个 SATA 3.0 接口;
b) 接口形态宜为 7Pin SATA 插槽或者 Mini-SAS HD 插槽;
c) 宜支持至少 1 个 PCIE x4 接口,速率不低于 Gen4,向下兼容,用于外接 NVME 硬盘。建议接口形态为 SlimSAS x8 插槽。PCIE 总数量不足时,宜复用显卡接口。
9.5 主板显卡接口技术要求
主板显卡接口宜满足的要求如下:
a) 应支持外接独立显卡,数量宜大于或等于 1 张;
b) 应支持至少 1 个 PCIE x16 接口,速率不低于 Gen4,向下兼容,可拆分为 2 个 PCIE x8 使用;
c) 建议接口形态为标准 PCIE 插槽,或者 GenZ 插槽;
d) 宜提供给显卡供电的接口,满足显卡功耗要求。
9.6 主板网卡接口技术要求
主板网卡接口宜满足的要求如下:
a) 应支持至少 1 个 PCIE x4 接口,速率不低于 Gen4,向下兼容;
b) 建议接口形态为标准 PCIE 插槽,或者 GenZ 插槽。支持 PXE 无盘引导、UEFI 无盘引导;
c) 速率不应低于千兆。
9.7 主板 USB 接口技术要求
主板 USB 接口宜满足的要求如下:
a) 支持应至少 2 个或以上 USB 接口;
b) 速率宜为 USB 3.0 或者 USB 2.0。
9.8 主板安全接口技术要求
主板宜支持 1 个 TPM 2.0 接口,通过该接口,可以在主板上固定一个安全卡。
9.9 主板带外管理接口技术要求
主板带外管理接口宜满足的要求如下:
a) 应支持 IPMI 接口远程带外管理;
b) IPMI 接口形态和 Pin 定义参考:宜使用 2.54mm 2x8 排针,排针定义应与图 5 相符合;
图 5 IPMI 接口信号定义参考示例
c) 应支持 BIOS 固件带外升级;
d) 应支持电压检测、温度检测、风扇控制和转速检测等;
e) 应支持实时获取主板的配置信息,固件版本信息等。
10 服务器管理功能设计技术要求
10.1 带外管理(BMC)总体功能技术要求
云游戏x86服务器一般需要进行远程管理,总体的功能要求如下:
a) 云游戏 x86 服务器中,应有带外管理(BMC)能力;对于整机包含多个节点的服务器,每个节点应具备单独带外管理模,或者多个节点共用一个带外管理模块,实现对服务器健康监测、
系统散热和电源等部件进行协同或统一管理;
b) 云游戏 x86 服务器中,带外管理复位和节点 CPU 复位解耦,互相不影响。同时,带外管理可以让节点 CPU 复位;
c) 云游戏 x86 服务器中,若采用 CRPS 电源,用户可以通过 IPMI 下发的下电命令可以关闭节点电源,此时节点断电;用户通过 IPMI 下发上电命令可以开启节点电源,此时节点上电;
d) 云游戏 x86 服务器中,应支持通过管理网口对带外管理固件进行升级,可在 CPU 侧操作系统(OS)下通过网络或其他通路对 BMC 固件升级;
e) 云游戏 x86 服务器中,应支持通过管理网口对节点 BIOS 固件、EC 固件等进行在线升级。
f) BMC 管理硬件要求见表 8。
表 8 BMC 硬件要求参考
10.2 BMC 管理功能细节技术要求
10.2.1 外设管理功能技术要求
外部设备种类比较多,基本管理功能和设计宜满足的要求如下:
a) BMC 应负责云游戏 x86 服务器外设的管理与监控。包括电源模块(PSU)、风扇 (Fan)、GPU 卡、网卡等;
b) 在硬件电路设计时,上述外设的 I2C 总线建议与带外管理芯片连接。
10.2.2 温度监控技术要求
整机或部件温度记录宜满足的要求如下:
a) BMC 管理可收集机箱部件及节点主板内部各温度传感器数据,机箱部件如CPU、节点、电源
I2C 或其他硬件总线获取;
b) 当温度异常时,如高于或低于工作温度,需要输出温度异常的事件记录。
10.2.3 系统风扇(System Fan)控制管理技术要求
建议由 BMC 负责管理控制系统风扇的转速,满足系统散热需求。同时监控系统风扇的运行状态,包括风扇转速、PWM 等。调控的方式可有 PWM 和 TACH 信号实现,也通过其他信道如 UART、IIC 等。
当 FAN 发生拔插、异常事件时,宜输出事件记录,并将 FAN LED 设置为对应的颜色。
异常事件包括但不限定于:
a) 停转;
b) 实际转速与设定值不符。
当 BMC 自身异常而无法控制 FAN 时,FAN 需要切换至固定转速,转速由厂商决定并提供。FAN 的控制需提供手动和自动两种控制模式,并且需提供切换接口。自动控制模式,需要结合温度传感器反馈的数据,根据比例积分微分算法(PID)或开环(Open-loop)算法, 自动计算出风扇转速占空比,并设置到风扇调速测率生效。算法需要对实时 PWM 进行校验和矫正。
10.2.4 电源模块(PSU)监控管理技术要求
带外管理系统(BMC)应负责监控电源模块的运行状态。如上电、下电、运行功耗、异常状态等。
当电源模块发生拔插、异常事件时,建议输出事件记录,并将电源模块的 LED 设置为对应的颜色。异常事件包括但不限定于:
a) 状态异常 (包括电源模块的风扇);
b) 过压、过流;掉电 (包括所有电源模块同时掉电);
c) 上电 (每个电源模块分别记录)。
10.2.5 日志记录管理技术要求
对于云游戏 x86 服务器的带外管理功能(BMC),需要监控和记录所有机箱内告警及状态更改。
日志类型建议包括但不限于:
a) BMC 系统日志;
b) SEL 日志 (可选);
c) 审计日志 (可选);
d) 操作日志 (可选);
e) 视频日志 (可选);
f) BIOS 串口日志 (可选);
g) BIOS POST 日志 (可选)。
所有日志应有途径收集和推送。推送和收集途径宜包括但不限于:
a) IPMI 2.0;
b) Redfish 1.5;
c) SNMP trap。
所有日志宜支持按种类和严重程度分类。且日志宜连续记录 300 条以上。
10.2.6 看门狗功能(Watchdog)技术要求
云游戏 x86 服务器在设计上宜支持硬件看门狗和软件看门狗,以应对在宕机工况下的自我重启,防止对业务造成过大影响。
硬件看门狗需要 BMC 持续向CPLD 器件进行喂狗行为,喂狗超时时,由CPLD 主动发起复位 BMC。
软件看门狗需要 BMC 系统内部对 SOC 指定 pin 脚进行喂狗行为,喂狗超时时,由 SOC 内部定时寄存器发起硬复位行为。
云游戏 x86 服务器宜按照 IPMI 2.0 标准实现看门狗功能。系统 BIOS 需在启动过程中,定期执行喂狗命令,并设置喂狗超时时间,超时后 BMC 执行相应的动作。
10.2.7 节点电源管理技术要求
云游戏 x86 服务器带外管理(BMC)应支持通过 IPMI、Redfish 等协议途径,远程对节点做上下电控制。
10.2.8 串口重定向 SOL (Serial Over LAN)技术要求
云游戏 x86 服务器在设计上应将节点 UART 连接至带外管理芯片,以实现通过标准 IPMI 命令远程访问系统串口的目的。
串口重定向(SOL)静置超时退出时长,应至少设定为 1 分钟。
当 SOL 激活并使用时,节点普通串口亦能正常使用,且二者同享输入输出。 (SOL 的输入普通串口能看到,反之亦然)。
10.3 BMC 管理能力技术要求
10.3.1 概述
此小节描述 BMC 模块自身的功能标准要求。
10.3.2 BMC 访问用户名与密码技术要求
用户名和密码管理宜满足的要求如下:
a) 用户宜支持通过默认的用户密码来远程访问 BMC,此默认用户的密码应可定制;
b) 系统应支持用户名和密码的设定;
c) 所有访问命令,除 IPMI2.0 协议强制要求的,均应同时支持使用和不使用参数-lanplus。
10.3.3 版本査询/其他信息査询技术要求
带外管理(BMC)应支持通过 ipmitool mc info 指令查询自身的版本信息。
BMC 对用户提供的版本号应使用x.xx 的格式。通过 ipmitool mc info 输出结果中的FirmwareRevision(固件版本信息)字段来展示。
10.3.4 IPMI 远程带外管理技术要求
BMC 管理模块应独立一个 IPMI 接口与业务网隔离,管理模块的重启,应不影响节点的业务正常运行,BMC 管理模块应可支持设备的现场可更换单元(FRU)信息获取、设备网络信息获取、设置带外网络、设置用户名密码、设置 PXE 、设置启动项、获取功耗信息的能力。
10.3.5 KVM 图像化管理技术要求
服务器的带外管理模块宜支持 KVM 功能。可通过Web 浏览器登录管理界面,进入 KVM 管理。
10.3.6 多种管理方式技术要求
设备宜同时具备命令行和 Web 管理界面配置,修改 IP 地址、用户密码、强制切换端口、获取设备信息等操作。
10.3.7 SNMP 告警技术要求
服务器配置的 BMC 管理模块,应具备节点与电源的告警能力。
10.3.8 Redfish 协议技术要求
服务器配置 BMC 管理模块,应支持 Redfish 协议标准,应具备的 Redfish 能力包含管理服务器的开机、关机、重启,网卡信息查询、网络信息查询、节点信息查询等。
10.3.9 可视化 BMC 管理后台技术要求
服务器配置的 BMC 管理模块,应具备可视化管理的能力,包含用户管理、设备信息查询、固件升级、告警信息查询、时间日期设置等。
10.3.10 固件版本升级技术要求
BMC 自身固件宜支持带内和带外两种升级方式:
a) 在 CPU 侧进行本地升级;
b) 通过网络远程升级 BMC。
两种方式下,BMC 升级过程均不应影响CPU 业务正常执行。
BMC 自身宜支持双镜像备份策略,当升级失败时,应从备份镜像启动 (非必须)。
11 服务器可维护性技术要求
服务器可维护性宜满足的要求如下:
a) 固件更新,宜支持远程更新 BIOS 和 BMC 固件,更新后能保存更新前的配置和用户资质信息;
b) 操作系统(OS)安装,应支持Windows和 Linux 远程挂载安装操作系统;
c) 可控制性,宜支持硬件接口能设置开启、关闭,支持功耗设置、支持风扇调速等;
d) 可观察性,设备运行时的不同状态通过状态指示灯应简单明确表示,模块或部件组装应有清晰易懂的对应丝印和表示;
e) 易操作性,产品操作手册和机房上架手册需应图文并茂,结构设计简单可靠(螺钉少),宜支持免工具拆卸、安装等;
f) 故障排查,通过远程管理应能快速检查出服务器硬件和软件的运行状况,关键事件要有日志记录;设置故障后通过日志能解析出故障点;
g) 故障恢复,单节点故障进行售后更换节点、节点内部件、节点内线缆时,其他节点的业务应不受影响;
h) 定期检查,宜支持定期进行服务器硬件和软件的检查,能够对整机与节点的健康状况以及操作系统和应用程序的运行状态;
i) 系统更新,以支持定期更新操作系统、驱动程序和安全补丁,确保服务器系统始终处于最新和最安全的状态;
j) 备份管理,应支持定期进行数据备份,并确保备份数据的完整性和可靠性,以防止数据丢失或损坏情况发生;
k) 性能优化,应有对服务器进行性能优化的可执行方案,包括优化系统配置、调整网络参数、清理系统垃圾文件等,以提升服务器的整体性能和响应速度;
l) 安全防护,宜支持定期进行安全审计和漏洞扫描,及时修补安全漏洞,加强防火墙设置和访问控制,保护服务器免受未经授权的访问和攻击;
m) 日志管理,宜支持日志导出功能、分类功能;
n) 监控管理,应支持通过远程管理能配置服务器监控系统,监测服务器的运行状态和性能指标,及时发现并解决性能异常和故障情况。
参 考 文 献
[1] 336521 ATX 3.0版本多路桌面平台电源设计指南 第2.1a版
[2] 573090 服务器通用冗余电源(CRPS)设计指南 第2.3版

评论