课题组构建了包括77个基因家族(共5,593个基因)的大麦基因家族数据库(BGFD:http://barleygfdb.com/)(Li et al., BMC Plant Biology 2022) (图 1),旨在提供一个涵盖功能注释、理化特性、系统进化、基因表达及遗传变异等信息的综合性数据库(图2)。BGFD是一个免费的、用户友好的、可网络访问的实用性平台,集成了检索、浏览、比对及下载等功能,为大麦关键基因家族的研究提供了重要资源,弥补了相关数据平台的不足。
图 1. BGFD主页
搭建了大麦转录组数据库(BarleyExpDB: http://barleyexp.com/)(Li et al., BMC Plant Biology 2023)(图 2),该数据库涵盖了来自公共平台及本实验室获得的共56项研究的3,492个大麦RNA-seq样本,提供了包括野生大麦、农家种、品种及青稞的不同组织、时期、逆境胁迫、突变体及多种遗传群体的转录全谱。BarleyExpDB支持针对Morex V2、Morex V3、B1K-04-12和Zangqing320等多个参考基因组基因集的快速检索,实现了基因注释、序列比对、表达量热图、数据下载等多种功能。特别地,该数据库有着较强的可拓展性,可便捷整合新发布的参考基因组和转录组,为大麦功能基因组学研究提供了重要数据支撑。
图 2. BarleyExpDB数据库流程图
课题组另搭建了小麦族SSR分子标记数据库TriticeaeSSRdb (http://triticeaessrdb.com/) (图 3),包含了来自21个物种的3,891,259个SSR,其中1,129,936个为基因区,2,761,323个为非基因。该数据库具有用户友好界面,可依据基因组区域、染色体、基元类型、重复基元序列等浏览SSR,高级检索功能也实现了限定染色体位置范围和长度的个性化搜索。数据库涵盖了目标SSR位点的侧翼序列,并提供了多对可选定制引物,供用户进一步PCR扩增验证。数据库整合了JBrowse、BLAST、MISA等实用工具,实现了全基因组检索、序列比对以及用户提供序列的SSR鉴定。随着新发基因组的不断增加,该数据库将持续纳入更多物种。构建的TriticeaeSSRdb有望成为大数据辅助麦类育种的有用资源,以推进基因组选择育种和作物改良。该数据库为开源、免费、网络可访问。
图 3. TriticeaeSSRdb数据库主页