基因组热潮过后,转录物组逐渐受到青睐
今年5月,首届人类基因组科学大会(The First Waterfront Symposium of Human Genome Science,WASH)在日本东京召开,120名来自世界各地的研究者聚集一堂,开始共同构建转录物组(transcriptome)数据库的框架,他们希望有朝一日这个数据库能够收录人类基因组中所有的基因表达序列。据本次大会的组织者介绍,这个数据库将在今年12月建成启用,并且将向全世界所有从事生物学研究及新药研发的工作者开放。此数据库的运作将由日本生物学信息研究中心(JBIRC)和日本DNA数据库(DDBJ)共同负责。东京大学医学研究所的研究人员Sumio Sugano说:“我们希望了解所有人类基因在基因组中的确切位置及其功能,这就是我们建立转录物组数据库的初衷。”
正如我们所知,体内蛋白质合成的第一步就是将基因(DNA)中的遗传信息转录到信使RNA(mRNA)中。通过这个过程,基因中的编码序列就与基因的其他部分(通常被称为“垃圾”DNA)分离开来。所谓转录物组,就是转录后的所有mRNA的总称。近几年来,研究者们都是以细胞中的mRNA为模板,通过逆转录方式获得互补DNA(cDNA),然后再利用cDNA回过头来研究这些转录产物。所以,对转录物组的研究完全可以通过研究cDNA来完成,而cDNA相对mRNA来说,实验室操作更容易、方便。
, http://www.100md.com
目前,大多数cDNA的数据都已经可以从各种公开的数据库中获得,但是其中有许多还不是完整的cDNA,而只是cDNA片段。另外,这些数据仍然存在着许多缺陷,例如有些数据没有进行正确的分类,来源于不同数据库的数据之间可能存在不一致的地方等等。cDNA数据的这些缺陷阻碍了它们在研究中的实际应用。因此,科学家们一直希望能够将所有收集到的人类cDNA序列加以整理,并收录到同一个数据库中,这样,科研人员的工作就可以更加规范和准确了。在本次东京大会上,学者们对2万多条基因的cDNA数据(占整个转录物组的一半以上)进行了分析,以初步确定数据库的入选标准和内容。
目前,研究人员从人类基因组中寻找基因,通常的做法是在整个基因组序列中查找特定的碱基序列,并由此推测这一片段的可表达性。这一预测的过程一般都会或多或少地带有误差。不过,如果研究人员是通过cDNA来完成这项工作,那就会使操作步骤变得更加简单、准确。本次会议的组织者之一,DDBJ的主任Takashi Gojobori 说:“转录物组数据库将是真正的人类基因的汇总,因为库中的数据不是利用推测的手段从人类基因组序列中获得的,它们都是真正的人类基因的转录产物。”美国俄亥俄州Cincinnati大学医学中心的基因组信息部主任Ranajit Chakraborty说:“100多名科学家将对所有这些收集到的cDNA数据进行核查,并有针对性地加以取舍,以保证这些数据的准确性。”
, http://www.100md.com
为了构建这个数据库,研究者们已经从全世界6个相关数据库中收集到了42000个cDNA数据,今后几个月内进行基因作图,并将它们逐个标记在人类基因组中23000个不同的区域内。研究者们发现,在相同区域内可能会出现许多不同的cDNA的重叠。对这一现象的深入探讨也许还将揭开人类基因组的其中一个奥秘——数目如此少的基因如何才能够制造出人类发展过程中如此众多的具有各种各样功能的蛋白质,同时,又如何才能产生出如此复杂的由人类遗传因素所决定的性状差异。
目前科学家们对这一现象的解释是,同一个基因可能会出现不同的剪接方式,因而同一段基因序列可能会转录成不同的mRNA,由此我们可以看到许多存在细微差异的各种cDNA覆盖在同一基因区域的现象。研究者们指出他们已经发现了许多类似的例子。
通过本次东京会议,研究者们收集并确定了大量的cDNA数据,并构建了这个数据库的平台。对于不能产生蛋白质的非编码序列,部分研究者相信它们在基因表达的调节过程中起着重要的作用,但这种说法目前还存在着争议。, http://www.100md.com
正如我们所知,体内蛋白质合成的第一步就是将基因(DNA)中的遗传信息转录到信使RNA(mRNA)中。通过这个过程,基因中的编码序列就与基因的其他部分(通常被称为“垃圾”DNA)分离开来。所谓转录物组,就是转录后的所有mRNA的总称。近几年来,研究者们都是以细胞中的mRNA为模板,通过逆转录方式获得互补DNA(cDNA),然后再利用cDNA回过头来研究这些转录产物。所以,对转录物组的研究完全可以通过研究cDNA来完成,而cDNA相对mRNA来说,实验室操作更容易、方便。
, http://www.100md.com
目前,大多数cDNA的数据都已经可以从各种公开的数据库中获得,但是其中有许多还不是完整的cDNA,而只是cDNA片段。另外,这些数据仍然存在着许多缺陷,例如有些数据没有进行正确的分类,来源于不同数据库的数据之间可能存在不一致的地方等等。cDNA数据的这些缺陷阻碍了它们在研究中的实际应用。因此,科学家们一直希望能够将所有收集到的人类cDNA序列加以整理,并收录到同一个数据库中,这样,科研人员的工作就可以更加规范和准确了。在本次东京大会上,学者们对2万多条基因的cDNA数据(占整个转录物组的一半以上)进行了分析,以初步确定数据库的入选标准和内容。
目前,研究人员从人类基因组中寻找基因,通常的做法是在整个基因组序列中查找特定的碱基序列,并由此推测这一片段的可表达性。这一预测的过程一般都会或多或少地带有误差。不过,如果研究人员是通过cDNA来完成这项工作,那就会使操作步骤变得更加简单、准确。本次会议的组织者之一,DDBJ的主任Takashi Gojobori 说:“转录物组数据库将是真正的人类基因的汇总,因为库中的数据不是利用推测的手段从人类基因组序列中获得的,它们都是真正的人类基因的转录产物。”美国俄亥俄州Cincinnati大学医学中心的基因组信息部主任Ranajit Chakraborty说:“100多名科学家将对所有这些收集到的cDNA数据进行核查,并有针对性地加以取舍,以保证这些数据的准确性。”
, http://www.100md.com
为了构建这个数据库,研究者们已经从全世界6个相关数据库中收集到了42000个cDNA数据,今后几个月内进行基因作图,并将它们逐个标记在人类基因组中23000个不同的区域内。研究者们发现,在相同区域内可能会出现许多不同的cDNA的重叠。对这一现象的深入探讨也许还将揭开人类基因组的其中一个奥秘——数目如此少的基因如何才能够制造出人类发展过程中如此众多的具有各种各样功能的蛋白质,同时,又如何才能产生出如此复杂的由人类遗传因素所决定的性状差异。
目前科学家们对这一现象的解释是,同一个基因可能会出现不同的剪接方式,因而同一段基因序列可能会转录成不同的mRNA,由此我们可以看到许多存在细微差异的各种cDNA覆盖在同一基因区域的现象。研究者们指出他们已经发现了许多类似的例子。
通过本次东京会议,研究者们收集并确定了大量的cDNA数据,并构建了这个数据库的平台。对于不能产生蛋白质的非编码序列,部分研究者相信它们在基因表达的调节过程中起着重要的作用,但这种说法目前还存在着争议。, http://www.100md.com