JJF 2396-2026 高通量基因测序仪校准规范

文档天下 图书评论5阅读模式
资源简介

  中华人民共和国国家计量技术规范

JJF 2396—2026

高通量基因测序仪校准规范

Calibration Specification for High‑throughput Gene Sequencers

2026‑04‑02 发布 2026‑10‑02 实施

国 家 市 场 监 督 管 理 总 局 发 布

高通量基因测序仪校准规范

Calibration Specification for

High‑throughput Gene Sequencers

aaaaaaaaaaaaaaaaa丶

JJF 2396—2026

丶aaaaaaaaaaaaaaaaa丶

归 口 单 位: 全国生物计量技术委员会

主要起草单位: 中国计量科学研究院中国测试技术研究院

参加起草单位: 深圳华大智造科技有限公司

本规范委托全国生物计量技术委员会负责解释

本规范主要起草人:

张永卓(中国计量科学研究院)

王 晶(中国计量科学研究院)

董莲华(中国计量科学研究院)

周李华(中国测试技术研究院)

杨杰斌(中国测试技术研究院)

参加起草人:

蒋 慧(深圳华大智造科技有限公司)刑楚填(深圳华大智造科技有限公司)

引 言

JJF 1071—2010 《国家计量校准规范编写规则》、 JJF 1001—2011 《通用计量术语及定义》 和 JJF 1059. 1—2012 《测量不确定度评定与表示》 共同构成支撑本规范制定工作的基础性系列规范 。

本规范的校准方法及计量特性等主要参考了 GB/T 30989—2014 《高通量基因测序技术规程》、 GB/T 40226—2021 《环境微生物宏基因组检测 高通量测序法》、 YY/T 1723—2020 《高通量基因测序仪》。

本规范为首次发布 。

高通量基因测序仪校准规范

1 范围

本规范适用于高通量基因测序仪(单次测序长度≤1 000 bp) 的校准 , 不适用于桑格(Sanger) 测序技术为原理的基因测序仪和纳米孔技术为主要原理的单分子测序仪的校准 。

2 引用文件

本规范引用了下列文件:

GB/T 30989—2014 高通量基因测序技术规程

GB/T 40226—2021 环境微生物宏基因组检测 高通量测序法

YY/T 1723—2020 高通量基因测序仪

凡是注日期的引用文件 , 仅注日期的版本适用于本规范 ; 凡是不注日期的引用文件 ,其最新版本(包括所有的修改单) 适用于本规范 。

3 术语

GB/T 30989—2014 、 GB/T 40226—2021 、YY/T1723—2020 界 定 的 以 及 下 列 术语和定义适用于本规范 。

3. 1 高通量基因测序 high_throughput gene sequencing

能够一次并行对大量核酸分子进行平行序列测定的技术 。

3. 2 高通量基因测序仪 high_throughput gene sequencer

基于片段化的 DNA ,依赖独立反应体系进行克隆扩增 , 能一次对几十万条以上核酸序列(DNA) 分子并行序列测定的仪器 。

[来源: YY/T 1723—2020 , 3. 7 ,有修改]

3. 3 文库 library

通过生物来源的 、人工合成的或克隆技术等所得的一个重建分子群 , 如基因组文库 、互补 DNA 文库 、噬菌体展示肽文库等 。

[来源: GB/T 30989-2014 , 3. 5]

3. 4 标签文库 tag library

将 DNA 样品随机打断后 , 在其两端连接带特定序列的接头 , 在接头之间的序列称标签 ,所有不同的标签的集合即为标签文库 。

[来源: GB/T 30989—2014 , 3. 6]

3. 5 碱基 base

一类含氮原子的有机杂环化合物 , 是组成嘌呤和嘧啶的主要成分 , 是拼出遗传密

码的 “ 字母”。

注 :DNA 中的碱基主要有腺嘌呤(Adenine ,A)、 鸟嘌呤(Guanine ,G)、 胞嘧啶(Cytosine,

C) 和胸腺嘧啶(Thymine ,T); RNA 中的碱基主要有腺嘌呤(A)、 鸟嘌呤(G)、 胞嘧啶(C) 和尿嘧啶(Uracil ,U)。

[来源: GB/T 30989—2014 , 3. 16]

3. 6 GC 含量 GC content

在 DNA 4 种碱基中 , 鸟嘌呤和胞嘧啶所占的比率 。

3. 7 测序片段 reads

高通量测序技术产生的短核苷酸序列 。常为几十到数百个碱基 。

3. 8 测序读长 read length of gene sequencing

单次运行可以读取的质量合格的序列片段长度 ,通常以碱基数量表示 。 [来源: YY/T 1723—2020 , 3. 4 ,有修改]

3. 9 基因测序通量 throughput of gene sequencing

单次测序可获得序列信息的基因片段数量或可测定的脱氧核糖核酸和核糖核酸(以碱基表示) 数量 。

[来源: GB/T 30989—2014 , 3. 21]

3. 10 碱基识别 base calling

测序过程中从荧光信号或电学信号转换成序列信息的过程 。

[来源: GB/T 30989—2014 , 3. 26]

3. 11 碱基识别质量 quality of base calling

衡量碱基被正确识别的概率 。通常以数字值直接表示 。

碱基识别质量与碱基识别错误率之间的关系可用公式(1) 表示:

Q =-10 lg P (1)

式中:

Q——碱基识别质量;

P ——碱基识别错误率 。

[来源: GB/T 30989—2014 , 3. 29]

3. 12 Q20

测序数据中 ,碱基识别质量值为 20 的碱基识别准确率为 99% , 或者错误率为 1% 。 [来源: GB/T 40226—2021 , 3. 5]

3. 13 Q30

测序数据中 , 碱基识别质量值为 30 的碱基识别准确率为99. 9% , 或者错误率为0. 1% 。

[来源: GB/T 40226—2021 , 3. 6]

3. 14 碱基识别错误率 inaccuracy of base calling

单次测序错误碱基数占碱基总数的比例 。

[来源: GB/T 30989—2014 , 3. 28]

3. 15 测序覆盖率 coverage rate of sequencing

待测样本的核苷酸序列检测结果覆盖于参考序列上的比例(测序覆盖率 = 覆盖区域长度÷参考序列总长度)。

[来源: GB/T 30989—2014 , 3. 30]

3. 16 测序深度 depth of coverage

待测样本中某个指定的核苷酸被检测的次数 。

[来源: GB/T 30989—2014 , 3. 31]

3. 17 平均覆盖深度 average depth of coverage测序深度的平均值 。

[来源: GB/T 30989—2014 , 3. 32]

3. 18 比对率 mapping rate

比对到参考序列上的片段数目除以总测序数据的片段数目 。

3. 19 序列相对丰度 sequence relative abundance某一指定序列在总样本中所占的相对比例 。

序列相对丰度可用公式(2) 表示:

式中:

N——序列相对丰度;

n ——比对到目标序列的片段数与目标的长度的比;

i ——第 i 个序列 。

[来源: GB/T 40226—2021 , 3. 2 ,有修改]

3. 20 参考数据库 reference database

已经测序 、分析或完全已知的序列数据的集合 。

注 :通常用于比对或分析其他个体的序列数据。

4 概述

高通量测序 , 也称为大规模并行测序(massively parallel sequencing , MPS) 或下一 代 测 序 (next generation sequencing , NGS), 有 效 解 决 一 代 测 序 (Sanger 测 序) 成本高 、通量低 、对人力需求高等问题 , 可一次对几百万到几十亿条核酸分子进行序列测 定 。 目 前 高 通 量 测 序 的 平 台 主 要 有 基 于 桥 式 PCR 扩 增 结 合 边 合 成 边 测 序 、乳 液PCR 扩增结合半导体合成测序 、DNA 纳米球滚环扩增结合联合探针锚定聚合技术等技术原理的测序仪 。

高通量测序仪(以下简称测序仪) 主要由主机 、基因测序仪控制软件组成 , 其中

主机包括主体架构 、操作系统主机 、光学系统 、XYZ 平台 、芯片平台 、气液系统 、 电子控制系统 、试剂存储系统 、 电源系统 、显示系统等组成(详见图1)。

图 1 测序仪结构示意图

5 计量特性

测序仪的计量特性 , 如表 1 所示 。

表 1 测序仪的校准项目

6 校准条件

6. 1 环境条件

6. 1. 1 环境温度:(10~30) ℃ 。

6. 1. 2 相对湿度: ≤80% ,无冷凝水 。

6. 1. 3 室内应具备良好的防尘措施 ,测序仪应远离振动 、 电磁干扰 。注 :上述条件与制造商的产品规定不一致时 , 以产品规定为准。

6. 2 校准用标准物质和试剂

6. 2. 1 标准物质: 校准时应采用来源稳定 、溯源信息完备 、参考序列信息已知的片段化 DNA 序 列 有 证 标 准 物 质 。 该 标 准 物 质 应 至 少 包 含 两 条 参 考 序 列 , 每 条 参 考 序 列长 度 ≥10 kbp 且 不 具 有 影 响 校 准 性 能 评 估 的 特 征 序 列 。参 考 序 列 相 对 丰 度 范 围 应 在40%~60% 之间 ,其扩展不确定度≤15%(k= 2)。

6. 2. 2 配制校准用标准物质所需超纯水: 电阻率不小于 18. 2 MΩ ·cm(25 ℃)。

6. 3 校准用设备及分析软件

6. 3. 1 移液器: 最大量程为 10 μL 、200 μL 、1 000 μL , 检定合格 。

6. 3. 2 分析软件: 原始数据分析使用 FastQC 、Fastp 、Trimmomatic 等 ; 比对分析使用 BWA 、Bowtie 、Bamstats 、Samtools 等 ;数据统计分析使用 SAS 、SPSS 等 。

注 :6.3.2 分析软件建议使用最新、通用或已验证版本。

7 校准项目和校准方法

将测序仪开机预热 30 min , 确保仪器达到正常工作状态后 , 按照测序仪上机流程对标准物质进行测序 , 重复测定 3 次 , 将下机数据使用分析软件处理 , 与参考序列比对并进行统计分析 ,按照下面的校准方法开展校准 。

注 :如被校测序仪整体数据通量较大时 ,可进行一次测序 ,原始数据采用随机降采样方法进行分析。

7. 1 测序片段总数重复性

通过下机软件分析获得每次测序的总片段值 , 根据公式(3) 用总片段的相对标准偏差作为测序片段总数的重复性 。

式中:

RSDreads ——测序总片段的相对标准偏差 , 以百分数表示;

R max ——3 次测定结果的最大值;

R min ——3 次测定结果的最小值;

-

R ——3 次测定结果的平均值;

Cn ——极差系数 ,n= 3 时 , Cn = 1. 69。

注 :若测序仪通量过大导致测序次数少于 3 次 ,则此项可以不做。

7. 2 GC 含量偏差

测序获得 GC 的碱基数和总的碱基数 , 根据公式(4) 计算测序 GC 含量 。重复测定 3 次 ,分别获得 GC 含量百分比 , 根据公式(5) 和公式(6) 计算 GC 含量偏差 。

GC (4)

----

ΔGC% = GC% - GC% S (5)

式中:

GC% ——测序碱基是 G 和 C 的碱基数占总碱基数的比例;

nGC ——测序碱基是 G 和 C 的碱基数;

N 碱基 ——测序获得总碱基数;

ΔGC% ——GC 含量偏差;

----

GC% ——测序 GC 含量结果平均值;

GC% S ——GC 含量标准值;

GC% i ——第 i 次测序 GC 含量;

n ——测量次数 。

7. 3 碱基识别质量百分比

测序数据通过下机软件分析获得每次测序碱基识别准确率为 99% 和 99. 9% 的碱基数量以及总碱基数 , 根据公式(7) 和公式(8) 分别计算测序 Q20 、Q30 的结果 。

式中:

Q20 ——测序碱基识别准确率为 99% 的碱基含量占比 , 以百分数表示;

Q30 ——测序碱基识别准确率为99. 9% 的碱基含量占比 , 以百分数表示;

nQ20 碱基——碱基识别准确率为 99% 的碱基数;

nQ30 碱基——碱基识别准确率为99. 9% 的碱基数;

N 总碱基 ——测序获得总碱基数 。

7. 4 平均碱基错误率

测 序 数 据 通 过 下 机 软 件 分 析 获 得 每 个 碱 基 识 别 质 量 值 , 根 据 公 式 (9) 和公 式 (10) 计算平均碱基错误率 。

-

Q

-

P= 10 10 (9)

Qi (10)

式中:

P ——平均碱基识别错误率 , 以百分数表示;

Q ——所有碱基识别质量的平均值;

Qi ——第 i 个碱基识别质量值 。

7. 5 比对率

测序获得的原始数据 , 通过比对软件与参考序列进行比对 , 根据公式(11) 计算

测序比对率 。

式中:

R 比对率 ——测序比对率 , 以百分数表示;

nmap ——比对到参考序列上的片段数目;

N 总 reads——总测序数据的片段数目 。

7. 6 比对率重复性

获得 3 次测序数据的比对率 , 根据公式(12) 计算测序比对率的重复性 。

式中:

RSD 比对率 ——测序比对率的重复性 , 以百分数表示;

Rmax ——3 次测定比对率结果的最大值;

Rmin ——3 次测定比对率结果的最小值;

-

R 比对率 ——3 次测定比对率结果的平均值;

Cn ——极差系数 ,n= 3 时 , Cn = 1. 69。

7. 7 序列覆盖率重复性

测序获得的原始数据 , 通过比对软件与参考序列进行比对分析 , 获得覆盖率 。根据公式(13) 和公式(14) 计算测序覆盖率重复性 。

RSD 覆盖率 = L覆盖率 max - L覆盖率 min × - 1 ×100% (13)

Cn L 覆盖率

L覆盖率 (14)

式中:

RSD 覆盖率 ——测序覆盖率的重复性 , 以百分数表示;

L 覆盖率 max ——3 次测定覆盖率结果的最大值;

L 覆盖率 min ——3 次测定覆盖率结果的最小值;

-

L 覆盖率 ——3 次测定覆盖率结果的平均值;

Cn ——极差系数 ,n= 3 时 , Cn = 1. 69;

L 覆盖长度 ——覆盖区域长度;

L 总长 ——参考序列总长度 。

7. 8 测序一致序列准确率

测序获得的原始数据 , 通过比对软件与参考序列进行比对分析 , 根据公式 (15)计算测序一致性序列准确率 。

式中:

AC ——测序一致序列准确率;

MS ——指定目标区域错配碱基数;

MB ——指定目标区域碱基数 。

7. 9 序列相对丰度偏差

测序获得的原始数据 , 经比对后进行统计分析 , 根据公式(2) 获得目标序列相对丰度 , 根据公式(16) 计算目标序列相对丰度偏差 。

ΔN=N-Ns (16)

式中:

ΔN——目标序列相对丰度偏差 , % ;

N ——3 次测序目标序列相对丰度平均值 , % ;

Ns ——目标序列相对丰度标准值 , % 。

8 校准结果表达

校准记录应详尽地记载测量数据和计算结果 , 推荐的校准记录格式见附录 B 。各测 量 结 果 的 测 量 不 确 定 度 应 按 JJF 1059. 1 的 要 求 评 定 , 不 确 定 度 评 定 示 例 见 附 录 C 。经校准的测序仪应出具校准证书 , 校准证书应符合 JJF 1071—2010 中5. 12 的要求 。

9 复校时间间隔

由于复校时间间隔的长短是由测序仪的使用情况 、使用者 、测序仪本身质量等诸因素所决定的 , 因此送校单位可根据实际使用情况自主决定复校时间间隔 , 建议不超过1年 。

附录 A

校准原始记录参考格式

附录 B

附录 C

序列相对丰度偏差测量结果的不确定度评定示例

C . 1 测量模型

相对丰度偏差可由公式(C . 1) 给出:

C . 2 不确定度来源

不确定度来源包括:

a) 测序仪测量重复性引入的标准不确定度 u(N);

b) 标准物质引入的标准不确定度 u(Ns)

C . 3 标准不确定度的评定

C . 3. 1 测量重复性引入的标准不确定度 u(N)

实际校准时在重复性条件下连续测量 3 次 , 以 3 次测量的算术平均值作为结果 ,计

算其实验标准偏差 sN 和标准不确定度 u(NN) 。其中,

sN (C . 2)

式中:

sN ——实验标准偏差 , % ;

Nmax——3 次测定结果的最大值 , % ;

Nmin ——3 次测定结果的最小值 , % ;

C n ——极差系数 ,n= 3 时 , C n = 1. 69。

u (C . 3)

结果见表 C . 1。

表 C. 1 测量重复性引入的标准不确定度数据

C . 3. 2 标准物质引入的标准不确定度 u(Ns)

由标准物质引入的不确定度分量 u(Ns)可以根据标准物质证书提供的扩展不确定度

U(Ns)和包含因子 k 根据公式(C . 4) 计算:

u (C . 4)

式中:

u (Ns) ——标准物质引入的标准不确定度;

U ( Ns )——标准物质证书提供的扩展不确定度;

k ——标准物质证书提供的包含因子 。

经计算得 u (Ns)= 2. 6% 。

C . 4 合成标准不确定度 u ΔN

由公式(C . 5) 可得合成标准不确定度:

C . 5 扩展不确定度 UΔN

取包含因子 k= 2 ,则扩展不确定度 UΔN =2uΔN。

结果见表 C . 2。

表 C. 2 合成标准不确定度和扩展不确定度

附录 D

GC 含量偏差测量结果的不确定度评定示例

D . 1 测量模型

GC 含量偏差可由公式(D . 1) 给出:

D . 2 不确定度来源

不确定度来源包括:

c) 测序仪测量重复性引入的标准不确定度 u(GC%);

d) 标准物质引入的标准不确定度 u(GC%s)。

D . 3 标准不确定度的评定

D . 3. 1 测量重复性引入的标准不确定度 u(GC%)

实际校准时在重复性条件下连续测量 3 次 , 以 3 次测量的算术平均值作为结果 ,计

算其实验标准偏差 $GC% 和标准不确定度 u(GC%)。 其中,

式中:

$GC% ——实验标准偏差 , % ;

GC% max ——3 次测定结果的最大值 , % ;

GC% min ——3 次测定结果的最小值 , % ;

Cn ——极差系数 ,n= 3 时 , Cn = 1. 69。

u (D . 3)

结果见表 D . 1。

表 D. 1 测量重复性引入的标准不确定度数据

D . 3. 2 标准物质引入的标准不确定度 u (GC%s )

由标准物质引入的不确定度分量 u (GC%s )可以根据标准物质证书提供的扩展不确定度 U(GC%s )和包含因子 k 根据公式(D . 4) 计算:

u (D . 4)

式中:

u (GC%s ) ——标准物质引入的标准不确定度;

U (GC%s )——标准物质证书提供的扩展不确定度; k ——标准物质证书提供的包含因子 。

经计算得 ,u (GC%s )= 2. 60% 。

D . 4 合成标准不确定度 u ΔGC%

由公式(D . 5) 可得合成标准不确定度:

D . 5 扩展不确定度 UΔGC%

取包含因子 k= 2 ,则扩展不确定度 UΔGC% = 2uΔGC% 。

结果见表 D . 2。

表 D. 2 合成标准不确定度和扩展不确定度

资源下载此资源下载价格为6金币立即购买,VIP免费

1.本站大部份文档均属免费,部份收费文档,经过本站分类整理,花了精力和时间,收费文档是为了网站运营成本等费用开支;
2.购买会员(或单次下载)即视为对网站的赞助、打赏,非商业交易行为(不认同此观点请勿支付)请慎重考虑;
3.所有收费文档都真实可靠,为了节约成本,文档在网站前台不做预览,如果付费后,与实际文档不符合,都可以加微信号:pdftj888申请退款;
4.付费下载过程中,如果遇到下载问题,都可以加微信号pdftj888解决;
5.手机支付,尽量选择支付宝支付;
6.如图集或者标准不清楚,在本站找不到您需要的规范和图集,希望增加资料等任何问题,可联系微信号:pdftj888解决;

文档天下
  • 本文由 发表于 2026年5月27日 22:16:25
  • 转载请务必保留本文链接:https://www.998pdf.com/74589.html
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: