全球旧事资料 分类
ST,进行数据库搜索,找到与查询序列有一定相似性的序列。一般认为如果蛋白的序列一致性为2530则可认为序列同源。BLAST根据搜索序列和数据库的不同类型分为5种(表2),另外PSIBLAST通过迭代搜索,可以搜索到与查询序列相似性较低的序列。其中BLASTN、BLASTP在实践中最为常用,TBLASTN在搜索相似序列进行新基因预测时特别有用。使用BLAST时,先选择需要使用的BLAST程序,然后提供相应的查询序列,选择所比对的数据库即可。
f2Needle和PairwiseBLAST:其中Needle适用于蛋白质和DNA序列,而PairwiseBLAST仅适用于DNA序列
(3)相似性和同源性:必须指出,相似性(similarity)和同源性homology是两个完全不同的概念。同源序列是指从某一共同祖先经过趋异进化而形成的不同序列。相似性是指序列比对过程中检测序列和目标序列之间相同碱基或氨基酸残基序列所占比例的大小。经过比对,当相似性高于一定程度,可以推测序列可能是同源序列,具有一定同源性。
2、多序列比对和进化树
在研究生物问题时,常常需要同时对两个以上的序列进行比对,这就是多序列比对。多序列比对可用于研究一组相关基因或蛋白,推断基因的进化关系,还可用于发现一组功能或结构相关基因之间的共有模式(patter
)。最常用的多序列比对工具为ClustalW(httpwwwebiacukclustalw),多用于比较蛋白序列。
ClustalW用法:
(1)输入:序列以FastA格式输入。
(2)输出:除了以文本形式外,还可以通过JalView显示和编辑结果。此外,还可以另外使用Ge
eDoc(常见于文献)及DNAStar软件等显示结果。多序列比对的结果还用于进一步绘制进化树。
3、ORFOpe
Readi
gFrame分析
从核酸序列翻译得到蛋白质序列,需要进行ORF分析,每个生物信息学分析软件包几乎都带有翻译功能。推荐使用NCBI的ORFFi
de(rhttpwww
cbi
lm
ihgovgorfgorfhtml)软件或EMBOSS中的getor(fhttpbioi
fopbi
rcca8090EMBOSS)软件。ORFFi
der以图形方式,分为正链1、+2、+3和反链+1、+2、+3六个相位预测ORF;Getorf可指定预测ORF的长度下限和指定预测正反链。进行ORF分析虽然比较简单,但应注意以下几点:
(1)序列的准确性:尤其是通过计算机拼接的序列,需要根据EST和基因组序列进行反复校正。
(2)ORF是否完整:看在ORF上游同一相位是否具有终止码,或者具有起始密码子。
(3)参考Kozak一致性规律,即起始密码子位点符合AGCCATGG。
(4)不要忽略反义读框。
4、染色体定位根据基因组图谱对序列进行染色体定位和浏览其基因组上下游基因。具体方法为:(1)进行Ger
好听全球资料 返回顶部