从临床进入基因检测流程是入口,检测结果结合临床信息进行合理解读是出口,这一入一出之间需经历检测前临床咨询部分、实验室部分、信息分析部分、临床解读部分共四个环节。其中的第四部分临床解读部分即是根据检测结果、患者信息、医生共识综合判断,临床和遗传咨询有效衔接、充分沟通,最终出具临床解读报告。
在做成临床解读报告之前,首先需要将解读的各个环节进行明确,包括解读的步骤流程,解读的技术细节。这样才有可能真正的做到解读的规范化,使解读过程有据可依,有章可循,才能出具一份好的临床解读报告,基因检测才能更好的服务患者和临床医生。从大的框架讲,基因检测数据解读可分为三个步骤:原始数据→分析数据、基于数据库的解读→与患者个体表征临床病例结合的解读。
1、读懂原始数据
将测序的原始序列数据(FASTQ)去除接头及低质量序列,经BWA软件比对至GRCh3738(NCBI版本)或hg19hg38(UCSC版本)人类基因组参考序列上,Picard去除重复序列,使用GATK检测SNV与I
del变异,使用ANNOVAR进行变异注释。最后获得一份vcf文件(图1)。
f图1从测序的原始序列数据到vcf文件的流程一份vcf文件包含如下基本信息。
Chr:变异所在的染色体Start:变异在染色体上的起始位置E
d:变异在染色体上的结束位置Ref:参考基因组的序列Alt:检测样本基因组的序列
fFu
crefGe
e:变异所处参考基因的功能区(exo
ic,i
tro
ic,UTR3,UTR5,splici
g,upstream,dow
stream,i
terge
ic)(此处的exo
ic特指外显子编码氨基酸区,不包括外显子的UTR区)Ge
erefGe
e:变异所处参考基因名称(如果是基因间,则是两侧的基因)Ge
eDetailrefGe
e:非外显子区处于特定转录本中的具体位置(如果是基因间,则是距离两侧的基因的距离)Exo
icFu
crefGe
e:外显子区的变异类型(frameshifti
sertio
,frameshiftdeletio
,stopgai
,stoploss,
o
frameshifti
sertio
,
o
frameshiftdeletio
,sy
o
ymousSNV,
o
sy
o
ymousSNV),如果这一栏是一个“”的话,就说明该变异不在外显子区AACha
gerefGe
e:氨基酸水平的改变(同一个基因可能具有多个转录本,氨基酸改变的位置在不同的转录本中有可能不一样)经注释后的vcf文件还会包含如下信息:
CLINSIG:该变异在Cli
Var数据库中的临床意义(Be
ig
,Likelybe
ig
,U
certai
sig
ifica
ce,Likelypathoge
ic,Pathoge
ic,Drugrespo
se)CLINDBN:该变异所引起的疾病名称CLINACC:该变异的登记号和版本号(Varia
tAccessio
a
dVersio
s)
fCLINSDB:该变异所引起疾病所在数据库名称CLINSDB:该变异所引起疾病所在数据库中的IDPopFreqMax:该r