当前位置: 首页 > 期刊 > 《实验与检验医学》 > 2015年第6期
编号:1452177
利用公共数据库挖掘肿瘤关键基因
http://www.100md.com 2015年12月19日 实验与检验医学 2015年第6期
差异基因,信息学,肝癌,1材料与方法,2结果,3讨论
     卢 娟,郑剑锋

    (1、江西省儿童医院检验科,江西南昌330006;2、南昌大学第二附属医院,江西南昌330006)

    利用公共数据库挖掘肿瘤关键基因

    卢 娟1,郑剑锋2

    (1、江西省儿童医院检验科,江西南昌330006;2、南昌大学第二附属医院,江西南昌330006)

    目的利用公共数据库挖掘肝癌发生过程的关键基因,为后续的功能验证奠定基础。方法以肝癌表达谱芯片数据GSE33006为例,采用免费开源的R/BioConductor分析工具,介绍基本分析步骤,对肝癌表达谱数据进行分析。结果芯片数据GSE33006中,差异表达基因有2134个,同一基因在癌组织和癌旁组织具有不同的表达模式,说明该基因与肝癌相关;同一基因在不同的癌组织表达存在差异,说明肝癌存在异质性。结论在公共数据库中挖掘肿瘤关键基因能为研究者提供生物信息学信息,能减少研究范围。

    肿瘤数据库;基因表达;R/BioConductor;数据挖掘

    单从基因层面看,肿瘤的发生、发展与多种癌基因过度激活,以及肿瘤抑制基因失活密切相关[1],探索研究新的基因功能改变与肿瘤发生发展关系,对揭示其发生发展的精确分子机制,进一步提高肿瘤的防治水平具有重要意义。对于肿瘤这类复杂疾病,人类的认识依然有限,如何从海量数据中提取有价值的信息,是研究者面临的一个挑战。随着基因芯片技术的迅速发展,表达谱芯片分析已被广泛应用于生命科学各个研究领域,由此产生的数据也呈指数级增长[2,3]。如何利用这些海量数据并从中获取有生物学意义的信息成为摆在研究者面前的难题。目前,对表达谱芯片数据挖掘方法要求有专业的生物信息学知识,而生物信息学处理往往采用Linux系统,而在应用最为广泛的windows系统下进行数据挖掘进一步限制了分析工具的使用。为解决这一系统限制,本文以肝癌表达谱芯片数据为例,在windows系统下用R/Bio-Conductor,结合免费的网络资源,采用具体的实例和代码分析Affemetrix芯片结果,对肿瘤数据挖掘,介绍基本分析步骤,以期为非生物信息学专业的临床科研工作者提供一种易于上手的数据分析方法。

    1 材料与方法

    1.1 BioConductor在windows系统的安装BioConductor是R的扩展包 ......

您现在查看是摘要页,全文长 8441 字符