系统的保护和利用已成为一个世界性的课题。利用遗传学的方法对林木进行改良能够充分利用自然生产潜力,提高林产品产量和品质,增强林木抗性以及充分发挥林木的多种生态效益。然而,与水稻、玉米等其他草本农作物育种的高速发展不同,林木的生长周期较长,并且基因组普遍比较大,使得通过反向遗传学的方法找寻和精确定位优良突变受到限制,因此林木育种整体研究进展缓慢。传统的育种学方法已经难以满足人类对林产品的快速需求。随着分子生物学技术的飞跃式发展,大量的分子标记被运用到林木遗传育种中,然而无论是通过实验遗传学还是比较遗传学的方法都在对基因快速准确的分析定位上受到了一定的限制。在林木中构建较高密度的遗传图谱不仅耗时耗力,而且得到的信息量较少3。1975年英国生化学家FrederickSa
ger发明了末端终止法DNA测序技术4,打开了解读生命“天书”的大门。但是利用Sa
ger测序的方法得到一个高等生物的全基因组序列需要花费大量的时间和资金,基因组学在生命科学领域中的广泛应用也受到一定的限制。然而,21世纪以来基于高通量的第2代和第3代测序技术的出现使得基因组测序所需的时间和成本大大降低,让以前遥不可及的基因组测序工作简单到一个实验室都可以进行。以2006年毛果杨(Populustrichocarpa)全基因组序列的发布为契机5,林木遗传育种学研究从基本遗传平台构建研究的初始阶段,快速进入到以功能基因组研究为代表的后基因组时代。该文概述了林木基因组学研究的进展,探讨了高通量测序技术对林木遗传育种带来的机遇和挑战,以为我国林木遗传育种学研究提供有益的参考。1林木基因组研究进展植物中包含的多基因家族数量非常大6,并且与动物相比其多倍体频率要高很多,这使得植物中旁系同源paralogy呈常态化。因此,通过高通量测序所产生的短小的reads常无法map到参考基因组,并且等位基因变异很难从相近的基因家族成员中区分出来。此外,由于植物基因组中广泛存在拷贝数量变异,即便是有高质量的参考基因组旁系同源仍然很难解决78。基于以上原因,植物基因组研究的进展相对于缓慢。根据美国能源部联合基因组研究所(DOEJGI)公布的数据(http:wwwjgidoegov)已测序完成的基因组中高等植物基因组只占了很小的比例。木本植物基因组的杂合度较高、基因组通常较大,且多数发生过基因组的复制,遗传背景不清晰,使得林木全基因组测序研究远远落后于其他植物9。全世界有超过10万种的木本植物,仅有10个左右的基因组被公布出r