基因突变国际(HGVS)标准表示标准

人类基因组变异协会(HGVS, Human Genome Variation Society)所制定的突变命名规则,是当前全球学术界与临床遗传学领域公认的、用于精准描述基因变异的标准规范,它为基因突变、多态性等遗传变异的命名提供了统一、明确且可追溯的标准化表示方式[1-2]。
1. HGVS对人类基因组变异的标准命名
表1 突变表示方式及中文释义
2. 举例说明标准表示后的含义
根据人类基因组变异协会(HGVS)的命名规则,基因组变异主要分为以下几类,每类都有其特定的描述方式:
(1)置换(>)
指单个核苷酸被另一个不同的核苷酸所替代,在命名中使用“>”符号连接原始碱基与替代碱基。示例:g.1318G>T
(2)缺失(del)
指从序列中移除一个或多个连续的核苷酸,使用后缀“del”表示。示例:g.3661_3706del
(3)倒置(inv)
指一段长度大于一个核苷酸的序列,被其反向互补序列所替换,使用后缀“inv”表示。示例:序列CTCGA变为TCGAG,可描述为相应位置的倒置。
(4)重复(dup)
指一个或多个核苷酸的拷贝直接插入到原始序列的紧邻下游(即串联重复),使用后缀“dup”表示。示例:g.123_126dup(原序列“ATCG”后额外插入一份“ATCG”拷贝)
(5)插入(ins)
指在序列中插入一个或多个新的核苷酸,且插入的序列并非其上游序列的直接拷贝,使用后缀“ins”表示。示例:g.123_124insTACG(在位置123和124之间插入了序列“TACG”)
(6)缺失-插入(delins)
指一段序列被移除,并被另一段不同的序列所取代。这是一种组合事件,既非简单置换,也非倒置或转换,使用“delins”表示。示例:g.100_105delinsTTGA(位置100至105的原始序列被“TTGA”取代)
(7)转换(con)
指一种特殊类型的缺失-插入事件,其中替代原始序列的新序列来源于基因组中的另一个位点,可理解为一段序列被“拷贝”并“粘贴”到当前位置,取代了原有序列。示例:g.100_200con500_600(表示位置100-200的序列被位置500-600的序列所替换)
3. 不同维度表示方法存在差异
描述基因变异时,其具体表述形式取决于所采用的参考序列与分子层次(如DNA、RNA或蛋白质)。目前通用的参考序列主要包括:
(1)基因组参考序列(前缀 g.);
(2)cDNA参考序列(前缀 c.)
(3)非编码DNA参考序列(前缀 n.)
(4)RNA参考序列(前缀 r.)
(5)蛋白质参考序列(前缀 p.)
参考序列的选择具有明确的实际意义。例如,在描述DNA层面的变异时,若需明确内含子区域突变与相邻外显子的位置关系,通常优先选用cDNA参考序列,因其编号体系能更清晰地体现外显子-内含子边界。此外,许多致病性变异常直接基于蛋白质序列变化进行描述,以直观反映其对蛋白质结构与功能的影响。
Ⅰ. cDNA突变表达方式
替换:指某个特定位置的碱基被另一种碱基取代,使用符号“>”表示。示例:c.123A>T 表示第123位的碱基A被T取代。
缺失:指一个或多个连续碱基发生丢失,使用后缀“del”表示。示例:c.2052delA 表示第2052位的碱基A缺失。
插入:指在特定位置之间增添了一个或多个新的碱基,使用后缀“ins”表示。示例:c.5756_5757insAGG 表示在第5756与5757位点之间插入了碱基序列AGG。
缺失插入:指一段序列被移除,同时被另一段不同的序列所取代(不属于简单替换、倒置或转换),使用“delins”表示。示例:c.6775delinsGA 表示第6775位的碱基缺失,并被序列GA取代。
重复:指一个或多个碱基的拷贝直接插入到原始序列的相邻下游(形成串联重复),使用后缀“dup”表示。示例:c.6_8dupT 表示第6至8位发生了碱基T的重复插入。
Ⅱ. 内含子突变描述
根据人类基因组变异协会(HGVS)命名规则,内含子中的突变以其相邻外显子为坐标进行描述。“+”表示下游内含子(位于外显子之后),“-”表示上游内含子(位于外显子之前)。具体表现形式如下:
表2 内含子突变的标准表示方式
蛋白质对应突变的表示方式
在蛋白质水平,HGVS命名规则使用前缀“p.”描述氨基酸序列的变异,具体类型及示例如下:
1. 替换
错义突变:一个氨基酸被另一个不同的氨基酸取代。示例:p.Trp26Cys(第26位的色氨酸被半胱氨酸取代)
无义突变:一个氨基酸被终止密码子取代。示例:p.Trp26Ter 或 p.Trp26*(第26位的色氨酸变为终止密码子)
同义突变:碱基改变未导致氨基酸变化。示例:p.Cys123=(第123位的半胱氨酸未改变)
2. 缺失
指一段连续的氨基酸序列发生丢失。示例:p.Ala3_Ser5del(从第3位的丙氨酸到第5位的丝氨酸缺失)
3. 插入
在指定位置之间插入一段新的氨基酸序列。示例:p.Lys2_Gly3insGlnSerLys(在第2位的赖氨酸与第3位的甘氨酸之间插入谷氨酰胺、丝氨酸和赖氨酸)
4. 缺失-插入
一个或多个氨基酸被一段不同的序列所取代。示例:p.Cys28delinsTrpVal(第28位的半胱氨酸缺失,并被色氨酸和缬氨酸取代)
5. 重复
一个或多个氨基酸的串联重复。示例:p.Ala2[10](第2位的丙氨酸重复了10次)
6. 移码突变
因碱基的插入或缺失导致阅读框改变,通常以“fs”表示,并标注新的终止密码子位置。示例:p.Arg97ProfsTer23(第97位的精氨酸变为脯氨酸,并由此发生移码,新的终止密码子位于第23位)
参考
[1] https://www.hgvs.org/
[2]https://www.plob.org/article/27350.html