全球旧事资料 分类
的重复片段,但对DNA序列检索,就必须去除序列中的重复片段。5、本地BLAST的安装大家一般都做过基于网络的BLAST,但网络BLAST一般只能搜索一个序列,要搜索多个序列,特别是做大量的数据比较时,网络BLAST几乎是不可能的,这个时候我们就可以考虑做本地BLAST了。使用本地BLAST的原因特殊的数据库要求涉及序列的隐私与价值批量处理与其它本地程序配合使用其他原因??本地BLAST构建步骤下载BLAST的安装程序将BLAST保存到适当的位置点击安装程序来安装BLAST设置BLAST的相应参数下载BLAST的本地安装程序可以到NCBI的官方网站下载最新的BLAST程序。下载网址:ftpftp
cbi
ihgovblastexecutable注意一定要选择和你的计算机操作系统相匹配的程序,Wi
dows系如统要下载“blast2218ia32wi
32exe”。
f本地BLAST的相应参数设置告诉BLAST程序你的数据及数据库放在哪1建立一个新的文件并命名为:
cbii
i2在该文件中输入四行数据如下所示:NCBIData“C
cbiblastdata”(你的数据存放的文件夹)
BLASTBLASTDB“C
cbiblastdb”(数据库存放在的文件夹)3将该文件拷贝到你的Wi
dows或Wi
t目录里路径设置步骤右键点击我的电脑选择属性再选择系统属性选择高级标签选择环境变量双击path在路径中填入你的BLAST的可执行文件所在目录有的时候还需要重新启动电脑
f6、本地BLAST的使用数据库的获取最简单的方法是直接到NCBI或别的网站去下载也可以将自己的序列,或与自己工作相关的序列进行整理构建成一个小型的数据库注意:以上文件格式一般可存为fasta格式构建BLAST用的数据库将已构建好的数据拷贝到你所设定的数据库所在文件夹运行cmd命令在cmd环境中输入如下所示命令formatdbii
seqsfapFoT
db_
ame命令结束后你会发现在你的数据库文件夹里多了一些以db_
ame开头的文件,这些就是BLAST所需要的一些文件输入过程
fFormatdb的一些参数说明i输入文件,只能是一个文件oParseoptio
s(默认是FTTrueParseSeqIda
dcreatei
dexesFFalseDo
otparseSeqIdDo
otcreatei
dexesp文件类型(默认是TTprotei
F
ucleotideTFOptio
al
数据库名称不指出的话默认为输入文件名更多选项请参阅解压后的doc文件夹的formatdbhtml文件
f进行BLAST搜索在命今行下录入blastall命令及相应的参数打开输出文件分析结果,如果结果不好可以试着调整参数再次进行BLAST如下所示命令:blastallpblast
ddb_
ameiQUERYooutQUERYBlastall的一些参数说明1p程序名包括blastp通过蛋白质序列搜索蛋白质序列数据r
好听全球资料 返回顶部