全球旧事资料 分类
列长度的总和,再乘以一些系数。
f我们在获得一个Blast结果时需要看这两个指标。如果Blast获得的目标序列的Score值越高并且Evalue越低表明结果越可信,反之越不可信。其它的一些重要关键概念HSPHighScori
gPair:在局部比对时,得分高的匹配序列被称为高分值片段。LCRslowcompositio
alcomplexityregio
s:低复杂度区域,即这些区域的组成有某些偏好,比如DNA中的简单重复序列。在蛋白质中一些残基过多表现。在进行BLAST比较时,将会把LCRs屏蔽掉,防止它们过高评价匹配的显著性。在核酸中用
,在蛋白质中用X代替。giGe
Ba
kI
dex特定于Ge
Ba
k数据库中所赋予每一条序列的特定索引数字。
r
o
redu
da
tdatabase非冗余数据库,该库信息多,并且无冗余序列2、常用BLAST程序BLASTBasicLocalAlig
me
tSearchTool基于匹配短序列片段,并用一种强有力的统计模型来确定未知序列与数据库序列的最佳局部联配的一种程序。主要的BLAST程序PSIBLAST位置特异的迭代BLAST这个程序主要用来搜索蛋白质的“远亲”。
f首先,用户提交的蛋白质序列的所有“近亲”的列表被建立起来,然后这些蛋白质被结合成一种平均的“特征序列”。再用这个特征序列在蛋白质数据库中进行搜索,就会找出更大的一组蛋白质的列表。再将这个蛋白质列表生成一个不同的特征序列,这个序列被用来迭代地运行上述过程。通过在搜索中包含相关的蛋白质,PSIBLAST对于寻找已知蛋白进化上的“远亲”的灵敏度要比一般的blastp高很多。其它的一些BLAST子程序GappedBLAST允许在它产生的比对(alig
me
ts)中存在缺口。Megablast该程序使用“模糊算法”加快了比较速度,可以用于快速比较两个较长的序列。disco
tiguousmegablast与megablast不同的是主要用来比较来自不同物种之间的相似性较低的分歧序列。PHIBLAST模式发现迭代BLAST。Bl2seq给定两个序列,相互进行BLAST比对,快速检查两个序列是否存在相似性片断SpecializedBlastSpecializedBLASTpages
fCDSearch是使用RPSBLAST程序以一个蛋白质序列与保守结构域数据库Co
servedDomai
Database做比较。PairwiseBLASTPairwiseBLAST是用BLAST程序实现两个序列之间的比较。IgBLASTIgBLAST被开发出来以便于分析在Ge
Ba
k中的免疫球蛋白的序列。它允许用blastp或blast
来搜索
r资料库或一个由免疫球蛋白生殖系变化区基因的特殊的资料库。3、BLAST算法简介BLAST是一种基本局域比对搜索工具,主要用来搜索数据库中相似序列。它的搜索速度快并且把数据库搜索建立在了严格的统计学基础之上,是目前最常用的同源检索工r
好听全球资料 返回顶部