基因文库是指收集、存储和分析各种生物基因组信息的重要数据库,主要包括以下内容:
1. 基因序列:包括物种基因组的整体DNA序列及其注释信息,如编码蛋白质的基因、非编码RNA基因等。
2. 蛋白质序列:记录了已知蛋白质的氨基酸序列和相关注释信息,如蛋白质结构、功能等。
3. 基因表达数据:基于高通量测序技术(RNA-seq)获得不同物种在不同组织、发育阶段或环境条件下基因表达水平的差异信息和相关注释。
4. 遗传变异数据:记录了物种基因组的多态性和遗传变异信息,包括单核苷酸多态性(SNP)和插入/缺失(InDel)等。
5. 功能注释:对已有的基因信息进行注释,包括基因表达、蛋白质互作、信号转导通路等。
6. 模型生物基因组:收集并注释模型生物的基因组信息,为研究基本生物学问题提供重要资料。
7. 分析工具:提供在线或离线的生物信息处理软件和分析工具,如BLAST、ClustalW、KEGG等。