多穗柯转录组分析及黄酮类化合物合成相关基因的挖掘(2)
2 结果与分析2.1 组装
总共得到6 Gb的Clean Date,组装获得Unigene 41 043条,N50长度为1 472 bp,长度大于N50的Unigene 有8 977条,组装完整性较高,具体组装结果见表1。
通过BlastX与nr数据库进行比对,有28 970 条Unigene获得注释,从匹配的物种来源分析,有10.91%的Unigene注释到葡萄中,8.51%注释到可可中,其余分别为梅花8.19%、桃6.51%、白僵菌5.38%、麻风树4.85%、桑树4.24%、蓖麻4.12%、野草莓4.05%,橙子3.39%,其余39.85%注释到其他物种中,见图1。
随后将所有的Unigene比对到KOG数据库中,结果显示有15 957条序列获得17 067个注释信息,划分为25个功能分类。从基因功能分布特征中可以发现一般功能预测基因分布最多,多达3 751条,涉及翻译后修饰、蛋白翻转、分子伴侣功能的基因次之,有1 736条,而涉及核结构、胞外结构和细胞运动的基因很少 ......
您现在查看是摘要页,全文长 4072 字符。