基于高通量测序的玄参根部转录组学研究及萜类化合物合成相关基因的挖掘(2)
1.3 数据的拼接与组装 经测序获得的原始序列(raw reads),去除里面含有带接头的、低质量的reads,评估测序数据质量,并对测序数据进行过滤,从而获得干净序列(clean reads)。本研究采用Trinity[8]对clean reads进行拼接。该软件通过序列之间的重叠(overlap)信息组装得到重叠群(contigs),然后局部组装得到转录本(transcripts),最后用 TGICL和 Phrap 软件对转录本进行同源聚类和拼接得到单基因簇(unigene)。1.4 功能注释与分类 通过blastx将拼接所得unigene比对到Nr[10](Non-redundant protein database,非冗余蛋白数据库),Nt,Swiss-Prot(SwissProt protein database,蛋白质序列数据库),GO[11](Gene Ontology,基因本体论数据库)、KEGG(Kyoto Encyclopedia of Genes and Genomes ......
您现在查看是摘要页,全文长 4157 字符。