整合转录组学识别食管鳞癌关键基因细胞周期蛋白依赖性激酶抑制因子3
高通量,模块,1资料与方法,2结果,3讨论
王万鹏,张启迪,傅承宏,陈皓瑜,周素芹,刘艳艳,何中祥,宋 坚,濮 娟(1.南京医科大学康达学院附属涟水人民医院放疗科,江苏 淮安 223400;2.南京医科大学康达学院附属涟水人民医院中心实验室,江苏 淮安 223400;3.上海交通大学医学院附属上海市第一人民医院消化科,上海 200080)
食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)占食管癌中的约90%,是起源于食管鳞状上皮系统的恶性肿瘤,其发病是多阶段、多基因、多步骤的联合作用导致[1]。随着肿瘤大数据的普及,网络公共平台也提供了大量的肿瘤组学数据,为研究肿瘤的生物学本质提供了极大的便利。但单个研究样本量较小,且各研究间存在批次、标本获取方法、实验目的或实验条件的不同,结果差异较大。虽然不同的数据整合方法也相继出现,但由于每种方法都有各自的不足,限制了其广泛应用[2]。本研究采用秩聚合(RRA)方法整合来自公共平台的多套ESCC 表达谱数据,在获取相关差异表达基因(DEGs)后通过构建蛋白互作(PPI)网络进行基因模块挖掘,使用TCGA 数据库中的ESCC 表达数据及免疫组化方法加以实验验证,以期寻找影响ESCC 发病机制的关键基因,为进一步探究ESCC 生物标志物和分子靶点提供新的科学思路。
1 资料与方法
1.1 资料来源 收集基因表达综合数据库(gene expression omnibus,GEO)中ESCC 转录组表达谱数据原始文件(raw data)。收集标准:包含癌组织及及癌旁组织且各组至少包含3 例。共收集到9 个系列的ESCC 表达谱数据:GSE77861、GSE77861、GSE100942、GSE26886、GSE17351、GSE38129、GSE33426、GSE20347、GSE23400。各数据集资料见图1。

图1 9 个ESCC 表达谱数据
1.2 数据预处理及整合转录组学差异基因分析 采用R 语言(3.6.2 版)中的Affy 包对原始数据进行预处理 ......
您现在查看是摘要页,全文长 9036 字符。