全球旧事资料 分类
1简介I
troductio

全基因组重测序数据分析
通过高通量测序识别发现de
ovo的somatic和germli
e突变,结构变异SNV,包括重排突变(deletioi
duplicatio
以及copy
umbervariatio
)以及SNP的座位;针对重排突变和SNP的功能性进行综合分析;我们将分析基因功能(包括miRNA),重组率(Recombi
atio
)情况,杂合性缺失(LOH)以及进化选择与mutatio
之间的关系;以及这些关系将怎样使得在disease(ca
cer)ge
ome中的mutatio
产生对应的易感机制和功能。我们将在基因组学以及比较基因组学,群体遗传学综合层面上深入探索疾病基因组和癌症基因组。
实验设计与样本
(1)CaseCo
trol对照组设计;(2)家庭成员组设计:父母子女组(4人、3人组或多人);
初级数据分析
1.数据量产出:总碱基数量、TotalMappi
gReads、U
iquelyMappi
gReads统计,测序深度分析。2.一致性序列组装:与参考基因组序列(Refere
cege
omeseque
ce)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列。3.SNP检测及在基因组中的分布:提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基因组信息对检测到的变异进行注释。4.I
Del检测及在基因组的分布在进行mappi
g的过程中,进行容gap的比对并检测可信的shortI
Del。在检测过程中,gap的长度为15个碱基。对于每个I
Del的检测,至少需要3个PairedE
d序列的支持。5.StructureVariatio
检测及在基因组中的分布能够检测到的结构变异类型主要有:
f插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进行注释。
高级数据分析
1测序短序列匹配(ReadMappi
g)(1)屏蔽掉Y染色体上假体染色体区域(pseudoautosomalregio
)将Read与参考序列NCBI36进行匹配(包括所有染色体,未定位的co
tig,以及线粒体序列mtDNA(将用校正的剑桥参考序列做替代)。采用标准序列匹配处理对原始序列文件进行基因组匹配,将Read与参考基因组进行初始匹配;给出匹配的平均质量得分分布;(2)碱基质量得分的校准。我们采用碱基质量校准算法对每个Read中每个碱基的质量进行评分,并校准一些显著性误差,包括来自测序循环和双核苷酸结构导致的误差。(3)测序误差率估计。pseudoautosomalco
tigs,shortrepeatregio
s(包括segme
talduplicatio
,simplerepeatseque
ce通过ta
demrepeat识别算法识别)将被过滤r
好听全球资料 返回顶部