第一节
基因诊断

杨 毅
遗传病的基因诊断是采用各种DNA分析技术,对先证者和家系进行分析,确定与疾病相关的基因、基因的突变类型或与致病基因紧密连锁的多态性标记,达到确诊患者的疾病、检出家系中突变基因携带者的目的,进而进行遗传病的诊断。
遗传病的基因诊断是以临床分析为基础的,因为除了少数基因变异已比较清楚或某些单基因病外,对大多数遗传病而言,情况则比较复杂,相关的致病基因有多个,遗传方式可能有多种(常染色体显性、常染色体隐性或X连锁),在进行基因诊断前需要对临床表型做出正确的评价,选择适当的基因分析方法。
基因分析的材料即DNA可从人体组织的有核细胞中提取,一般从外周血中分离,也可从口腔黏膜、发根毛囊细胞分离。进行基因分析时一般需采集核心家系成员(先证者及其父母)的DNA。进行基因携带者分析时,采集与患者、携带者有血缘关系的一级亲属样品。
随着DNA检测分析技术的快速发展和普及,一些高通量的DNA测序方法已逐步进入临床应用,基因诊断的准确性和效率不断提高,已成为遗传性疾病最主要的诊断手段,并且也扩展到复杂疾病和个体化应用等领域,包括高危疾病的早期筛查和基因携带的检测,以及药物相关基因的检测用于指导个体化用药等诸多方面。目前,临床常用的基因诊断方法主要包括基因测序、基因芯片、多重连接依赖性探针扩增(MLPA)、聚合酶链反应(PCR)及其相关基因分析方法等。
一、基因测序
(一)Sanger测序
基因诊断最可靠和准确的方法是对DNA分子的核苷酸排列顺序的测定,即测定组成DNA分子的A、T、G、C的排列顺序。早期的(第一代)测序技术包括Gilbert发明的化学降解法和Sanger发明的双脱氧链末端终止法,随后出现了以凝胶电泳为基础的DNA自动测序仪和以毛细管电泳为基础的DNA自动测序仪,尤其是后者已被广泛用于临床,并以此方法完成了人类基因组计划。Sanger测序方法具有高度的准确性和简单、快捷等特点,它是针对已知致病基因的突变位点设计引物,进行PCR直接扩增测序。单个突变点的扩增包括该位点在内的外显子片段即可,不必将该点所在基因的全部外显子都扩增。因此,对于致病基因位点明确并且数量有限的单基因遗传疾病的基因检测是非常经济和高效的。到目前为止,Sanger测序仍然是作为基因检测的金标准,也是对新一代测序技术基因检测结果验证的主要手段。然而,对于没有明确候选基因或候选基因数量较多的大样本病例筛查,Sanger测序是难以完成的,还要依靠具有高通量测序能力的二代测序方法。另外,Sanger测序不能检测出大片段缺失或拷贝数变异等基因突变的类型,因此对于一些与此相关的遗传性疾病还不能做出基因学诊断。
(二)高通量测序
又称新一代测序(next generation sequencing,NGS),是继Sanger测序法后的革命性的进步,它是基于大规模平行测序的理念,同时对上百万,甚至数十亿个DNA片段进行大规模并行测序,具有通量高、速度快、易操作、成本低等特点。近10年来,新一代测序技术发展迅速,仪器不断推陈出新,测序平台更替变化。虽然各测序平台都采用了边合成边测序的原理,但测序方法各有特色。近年来,新一代测序技术已进入临床,开始应用于遗传性疾病的诊断,早期筛查和个体化医疗策略的制定等。目前主要的检测策略包括全基因组测序(whole-genome sequencing,WGS)、全外显子组测序(whole-exome sequencing,WES)和目标区域测序(targeted regions sequencing,TRS)。
1.全基因组测序
它是获得个人遗传信息最有效的手段,能够在一次检测中发现基因组DNA编码区、非编码区和调控区内的所有变异,以及单核苷酸多态性(single nucleotide polymorphism,SNP)、插入缺失和结构变异等。但是,由于价格以及数据分析的复杂性,限制了其在临床的应用。
2.全外显子组测序(WES)
外显子组是个体基因组DNA上所有蛋白质编码序列的总和,涵盖了与个体表型相关的大部分功能性变异。人类基因中约有18万个外显子,约占人类全部基因组序列的1%,但包含约85%的致病突变。WES是利用序列捕获技术将全外显子区域DNA捕捉并富集后进行高通量测序的基因分析方法,检测范围可覆盖约95%的外显子区域。目前WES仍是发现遗传性疾病致病基因最有效的工具,当具有可疑遗传性疾病的临床表现,但致病性基因突变不明确或候选致病基因数较多时,可优先考虑采用 WES。除单基因遗传病外,WES还可应用于多基因影响的复杂疾病中发现新的致病基因。
3.目标区域测序
基于DNA杂交原理,利用目标基因组区域定制的探针与基因组DNA进行芯片杂交或溶液杂交,将目标基因区域DNA富集,再通过新一代测序技术进行测序。测序所选定的目标区域可以是连续的DNA序列,也可以是分布在同一个染色体不同区域或不同染色体上的片段。目标区域测序技术可以对经过连锁分析锁定了的目标范围,或经过全基因组筛选的特定基因,或区域做进一步检测,解决连锁分析无法发现致病基因的有效手段。该技术对于已知基因突变的筛查具有明显优势,可以快速、全面地检测出目标基因突变。同时,由于目标区域受到了限制,测序范围大幅度减少,测序时间和费用相应降低。
二、基因芯片
基因芯片是采用光导原位合成或显微印刷等方法将大量特定序列的DNA分子密集、有序地固定于经过相应处理的硅片、玻片、硝酸纤维素膜等载体上,与标记的待测核酸样品进行杂交,通过对杂交信号强弱及分布的分析,获得受检样品的遗传信息。目前,临床诊断采用的主要是基于芯片平台的微阵列比较基因组杂交技术(array-comparative genomic hybridization,aCGH),又称为染色体微阵列芯片分析技术(chromosomal microarray analysis,CMA),是近10年来出现的一种新的检测技术。该技术通过一次杂交实验可同时检测芯片上高达几十甚至上百万的DNA片段,它的分辨率取决于芯片上探针之间的距离,在局部区域使用高密度探针,可以检测到小于1kb的基因组片段的缺失与扩增,即拷贝数变异(copy number variations,CNVs)。该技术不仅可以快速有效地检测常规核型分析的染色体不平衡变异,而且可以检测到大量的常规方法未能检测到的微小变异,是非已知遗传性综合征的多发畸形、非综合征性的智力低下和发育迟缓以及孤独症谱系障碍的主要检测手段之一。
三、多重连接依赖性探针扩增
多重连接依赖性探针扩增(multiplex ligation-dependent probe amplification,MLPA)是一种高通量、针对待测核酸中靶序列进行定性和相对定量分析的新技术,其原理是对可与样本DNA正确杂交并被连接酶连接的探针进行扩增和半定量分析。该技术具有分辨率高(能区分核酸序列一个碱基的差异),样本需要量少(只需20ng人DNA或羊水0.5ml,约3000个细胞),操作简便(已有许多商品化试剂盒包含了所有必需的试剂,并将反应条件优化使所有试剂盒基本适用同一反应条件),设备要求低(只需普通PCR仪和测序仪)和检测效率高(一个反应同时检测多达50个基因组DNA序列的拷贝数,可在24小时内得到结果)等诸多优势而广泛用于检测人类基因组内拷贝数变异(CNV),染色体异常(如染色体亚端粒区域的基因拷贝数变化和13、18、21三体及X、Y等染色体非整倍性异常)、遗传性疾病基因缺失或重复(如脊髓性肌肉萎缩症及杜氏肌营养不良症)、基因甲基化检测(Prader-Willi综合征和Angelman综合征)等,是临床基因诊断的常用方法之一。
四、PCR及其相关的基因分析方法
PCR是临床最为常用的基本的DNA检测分析技术,可以快速准确地从少量DNA样品中扩增特异DNA片段,与各种标记技术结合应用,可对基因突变进行分析。
1.实时荧光PCR技术(real-time PCR)
又称作实时荧光PCR,是指利用荧光染料或荧光探针,在PCR过程中实时检测荧光的变化,获得PCR动力学曲线,借以实现对扩增模板的定性和定量分析。荧光探针可通过标记不同的荧光基团,实现多种靶序列的同时检测。具有操作简便,可定量和高通量检测的优点。然而,由于遗传病的检测对象多为DNA序列变异,对探针的特异性要求更高,而且绝大多数由多个基因位点的核酸变异引起,而实时PCR由于受到仪器检测通道数目的限制,每个反应所能检测的变异位点数目十分有限。因此,在遗传病检测领域,实时荧光PCR主要用于少数已知特定突变的检测,所涉及的疾病类型有限。
2.多色熔解曲线分析(multicolor melting curve analysis,MMCA)
是指采用不同荧光标记的自淬灭探针,在PCR完成后,检测荧光强度随温度的变化,获得探针与靶序列杂交的熔点(即 Tm 值),根据 Tm 值的变化,判断突变的发生及突变类型。不同荧光标记的探针可以检测不同位点的突变情况,因此,MMCA是一种多位点突变检测技术。具有检测灵敏、重复性好的优点,且多个探针共存可以检测多个基因区域的变异,因此使用范围大大超过常规的实时荧光PCR技术,可用于多个突变的基因分型、突变筛查,以及突变位点的识别等。
3.高分辨率熔解曲线分析(high resolution melting analysis,HRMA)
是根据DNA序列的长度、GC含量以及碱基互补性的不同,高分辨地识别熔解曲线的差异,进而对突变进行识别与分析。作为一项突变扫描和基因分型检测技术,HRMA可用于整个PCR产物中所有突变的筛查,且无需荧光探针。高分辨熔解对DNA序列的识别能力主要由三个因素所决定:检测仪器的分辨率、双链DNA嵌入型染料的种类和PCR产物的纯度。由于HRMA分析不受碱基突变位点和种类的限制,可用于突变扫描、基因分型、序列匹配、DNA甲基化等方面的研究,已经用于多种遗传病的诊断。