为什么我们会长得像父母?为什么有的人是单眼皮,有的人却是双眼皮?这都是由基因决定的。什么是基因呢?基因,是遗传的基本单元,也称为遗传因子,是一段携带有遗传信息的DNA序列。基因能够通过复制,把自己携带的遗传信息传递给下一代,基因也能够通过指导蛋白质的合成来表达自己所携带的遗传信息,从而控制生物个体的性状表达。再来,为什么北极熊的毛是白色的?为什么长颈鹿不会得高血压?这就是基因得另一个功能——基因突变的结果。那什么是基因突变呢?本文伯小医就带领大家好好了解一下,走进基因突变的世界!
一、基因突变的概念
基因突变(Gene mutation)是指基因组的核酸序列由于发生碱基的替换、增添或缺失而导致的基因碱基序列改变,不再是原有基因的现象。
从19世纪60年代,孟德尔提出“遗传因子”的论点,到1909年,约翰逊首次提出“基因”的概念,从1901年,狄·弗里斯首先提出“突变”一词,到1910年摩尔根首先发现果蝇中的白眼基因突变。此后越来越多的研究表明,基因是具有遗传效应的DNA片段,而基因突变也并非罕见,是生物中广泛存在的现象,尤其对于生命演化至关重要。当基因突变带来新功能,生命之树就有可能产生新的分支。但随机的、未修复的突变对进化可能是有益的,也可能是有害的。基因突变绝大多数会导致疾病,但也有另外的一小部分是非致病的,甚至使种群朝有利的方向进化。
图1 正常基因和突变基因的比较(a)以及不同水平的基因突变(b)(Gupta M et al., 2021)。
二、基因突变的的基本类型
基因突变可以发生在个体发育的任何阶段,以及体细胞或生殖细胞周期的任何时期。引起基因突变的原因包括自发突变(Spontaneous mutation)和诱发突变(Induced mutation),两种原因都会导致基因内部结构的改变,改变的类型主要有以下几种。1.碱基置换突变
一个碱基对被另一个碱基对取代而造成的突变称为碱基置换突变,也称点突变(Point mutation),当然这只是狭义上的点突变。发生点突变时,由于AGCT四个碱基中有两个是嘌呤,两个是嘧啶,当嘌呤被嘌呤取代,或者嘧啶被嘧啶取代时的置换称为转换(Transition);当嘌呤被嘧啶取代,或嘧啶被嘌呤取代时的置换称为颠换(Transversion)。转换有4种可能,而颠换有8种可能。在自然界中,转换通常多于颠换。2.插入或缺失突变(insertion/deletion mutation)
插入突变是指在基因组中插入一个或多个额外的碱基,缺失突变是指从基因组中删除一个或多个碱基。这些突变会改变基因组的读框,导致编码信息的改变。此外,单个碱基的插入或缺失,是点突变的另一种方式。3.移码突变
移码突变(Frame-shift mutation)是指在一条DNA链上插入或缺失1个、2个或者非3的整数倍个碱基,从而导致插入或缺失部位之后的密码子组成和顺序发生变化。由于mRNA上的3个碱基决定一个氨基酸。所以mRNA链上决定一个氨基酸的3个相邻碱基称为一个“密码子”。由于移码突变导致的原来的密码子移位,终止密码子就会提前或者延后出现,结果就是造成新合成的肽链缩短或延长。4.整码突变
整码突变(Codon mutation)又称密码子插入或丢失(Codon insertion or deletion),是指在基因的密码子之间插入或缺失一个或几个密码子(即3或3的倍数个碱基),导致合成的肽链增加或减少了一或多个氨基酸,但插入或缺失部位前后的氨基酸顺序不变。
而当上述五种类型导致碱基变换后,根据后续对合成蛋白的影响,又会分为以下四种突变类型。
①同义突变
由于密码子的简并性,基因的碱基序列改变后,突变的密码子仍然编码原来的氨基酸,并未引起多肽链中氨基酸的改变,不影响蛋白质的功能,因而表型不会发生变化,也称沉默突变。
②错义突变
基因的碱基序列改变后引起密码子变化,导致编码的氨基酸发生改变,由原来的氨基酸变成了另外一种氨基酸,但该氨基酸前后的氨基酸不改变。这种突变可能对编码的蛋白没有影响,也可能是有利影响,但大多数是产生功能异常的蛋白质,带来有害或致死的效应。
③无义突变
基因的碱基序列改变后,导致编码某一氨基酸的密码子变成终止密码子(UAG、UGA和UAA),使翻译提前终止,产生一条不完整的多肽链,导致所编码的蛋白质被截掉一部分,失去活性或丧失正常功能。
④终止密码突变
基因的碱基序列改变后,导致终止密码子(UAG、UGA和UAA)变成编码氨基酸的密码子,使多肽链的合成继续进行下去,直至遇到下一个终止密码子,结果就是形成超长的异常多肽链。
图2 不同类型的突变以及对蛋白质功能可能产生的后果(Kassem H S et al., 2012)。
三、基因突变的命名
为了使基因突变以规范化的形式呈现出来以方便交流和解读,人类基因组突变学会(Human Genome Variation Society,HGVS)制定了较为详尽的突变表示方法,即HGVS命名法。HGVS命名法是国际公认的描述DNA、RNA和蛋白质序列变体的标准。它用于在临床报告中传达变体,并在出版物和数据库中共享变体。(https://hgvs-nomenclature.org/stable/)1、一般命名规则:
描述基因突变时,应遵循以下三条规则:
(1)首先描述DNA水平的变异,然后再描述RNA水平和蛋白质水平的变异;
(2)应描述清楚所发生的变异是经过检测确切发生的变异还是理论上推导出的变异;
(3)应当指出所参考的原始基因序列。
2、字符:
HGVS命名的字符均有特定的意义。
3、描述变异的缩略符号:
特定的缩略符号用来描述不同的变异类型。
讲了这么多,伯小医来给大家举个栗子。
①以DNA为参考序列的突变表达方式
RNA序列以小写字母a、c、g、u进行描述,与DNA描述类似,具体术语可参阅HGVS网站。
A、替换
(1)g.54675C>A,表示基因组第54675位核苷酸”C”被替换为”A”;
(2)c.66G>H,表示编码DNA参考序列的第66位核苷酸由”G”可能变异成”A”、”C”或”T”中的任何1种(H是IUPAC的编码,表示碱基的兼并性)。
B、缺失
(1)g.7del表示基因组中第7位核苷酸的缺失,如TCGTGGCACG到TCGTGG_ACG的变异,即第7位有1个”C”的缺失,也可以描述为g.7delC;
(2)g.6_8del表示基因组中第6~8位核苷酸的缺失,如ACAATATCC到ACAAT_C的变异,即第6~8位核苷酸序列”ATC”的缺失,也可以描述为g.6_8delATC。
C、复制
(1)g.7dup表示基因组第7位核苷酸T的复制,即从ACTTACTGCC到ACTTACTTGCC的突变,也可表示为g.7dupT;但不能描述为g.6_7insT或g.7_8insT;
(2)g.123_345dup{234A>G}表示基因组第123_345位核苷酸发生复制,并且在复制序列中第234位核苷酸A变异为G。
D、插入
(1)g.4426_4427insA表示在基因组第4426和4427位核苷酸之间插入了A;
(2)g.5756_5757insAGG表示在基因组第5756和5757位核苷酸之间插入了AGG。
②以蛋白质为参考序列的突变表达方式
A、替换:
(1)p.Ala78Cys,表示第78位的Ala被Cys取代(错义突变);
(2)p.Cys123=,表示基因突变之后,氨基酸没有发生改变(同义突变)。
B、缺失:p.Ala8_Cys11del,表示多肽序列中从第8位的Ala到第11位的Cys发生了缺失。
C、插入:如p.Cys3_Gly6insAlaSerAla,表示在第3位的Cys和第6位的Gly之间插入了AlaSerAla。
D、插入缺失:如p.Ala48delinsSerAla,表示第48位的Ala缺失,同时被SerAla替代。
小医叨叨
好的,小医今天就先带大家了解关于基因突变的简单知识,相信大家也看到了基因突变有多种多样的类型,对生命体有害亦有利,那它到底会带来哪些后果?我们又该怎样去检测以便预防或确认突变的发生?下期文章,小医再带大家一探究竟,我们不见不散呦!
参考文献
Gupta M, Wu H, Arora S,et al.Gene Mutation Classification through Text Evidence Facilitating Cancer Tumour Detection.[J].Hindawi Limited, 2021.DOI:10.1155/2021/8689873.
Kassem H S, Girolami F, Sanoudou D.Molecular genetics made simple[J].Global Cardiology Science and Practice, 2012, 2012(1):6.DOI:10.5339/gcsp.2012.6.