基因表达数据分析的方法
摘要:基因表达数据的一个重要应用是给疾病样本分类,如鉴别白血病的类型。而对成千
上万个基因表达进行分析,必产生总量巨大的数据集。近年来,支持向量机SVM的理论已经取得重大进展,其算法实现策略以及实际应用也发展迅速,开始成为克服“维数灾难”和“过学习”等传统困难的有力手段。利用这一技术分析与整理这些基因表达数据,已有效地解决了生物信息学上这一海量数据的瓶颈问题。本文就支持向量机在基因表达数据分析方面的算法和应用进行了介绍和分析。
关键词:生物信息学;基因表达数据;支持向量机
Methodsofge
eexpressio
dataa
alysis
Abstract:Ge
eexpressio
datahasa
importa
tapplicatio
totheclassificatio
ofdisease
samplessuchaside
tifyi
gthetypesofleukemiaThea
alysisofthousa
dsofge
eexpressio
datawillproduceatreme
dousamou
tofdatasetsI
rece
tyearssupportvectormachi
eSVMtheorythatsig
ifica
tprogresshasbee
madetowardsitsstrategya
dpracticalapplicatio
sofalgorithmshasbee
developi
grapidlya
dbecameovercomethe