基于加权基因共表达网络分析建立结肠腺癌预后风险模型以及关键基因药物敏感性分析
化疗,模块,1材料和方法,1数据采集,2差异表达基因分析,3WGCNA,4预后风险模型的构建,5基因集富集分析(GSEA),6药物敏感相关性分析,7统计学分析,2结果,1数据处理,2
黎蕴琪,蒋利和,陈闯*(. 广西医科大学附属肿瘤医院,南宁 53002;2. 右江民族医学院,广西 百色533000;3. 广西大学,南宁 530004)结直肠癌(colorectal cancer,CRC)是世界上最常见的消化系统恶性肿瘤之一。据统计,在全球范围内,CRC发病率排第三,病死率排第二[1]。结肠腺癌(colorectal adenocarcinoma,COAD)是CRC中最常见的病理分型。目前,根治性手术治疗是早期COAD最主要的治疗方法,而对中晚期患者来说,化疗是最常用且有效的选择,可限制肿瘤细胞的扩散和转移,进而控制病情。但化疗药物耐药性的产生和肿瘤的高复发率仍是COAD临床实践中的主要问题[2-3]。
近年来,生物信息学在挖掘癌症生物标志物[4]和抗肿瘤药物分子靶点[5]等研究方面发挥重要作用。加权基因共表达网络分析(WGCNA)主要运用于分析大样本基因表达数据,将基因根据表达模式相似性分为不同模块[6],这种方法跟普通聚类方法的不同在于其将基因表达值的相关系数取了N次幂,从而使得相关系数分布更加符合无尺度网络分析,这更符合生物学规律[7]。相比于只关注差异表达的基因,WGCNA充分利用信息,把基因与表型的关联转换为基因集与表型的关联,免去了多重假设检验校正的问题。本研究基于WGCNA结合差异表达基因(DEGs)的方法,构建高性能的预后预测模型,同时对这些靶点进行化疗药物敏感性分析,旨在筛选出高风险肿瘤患者并对其进行精准的靶向治疗,以达到个体COAD治疗疗效最大化。
1 材料和方法
1.1 数据采集
微阵列数据集GSE39582和GSE41258以及这些数据集的相应临床数据从GEO数据库(https://www.ncbi.nlm.nih.gov/geo)中下载,通过R软件进行数据归一化处理,利用limma包去除批次效应,通过ggord包绘制PCA图。GEO数据用于筛选DEGs,构建预后模型。从癌症基因组图谱(TCGA)数据库(http://cancergenome.nih.gov/)下载COAD的RNA-seq数据和相应临床信息。该数据集包括424个COAD样本,用于验证预后模型和生存分析。
1.2 差异表达基因分析
采用limma软件包寻找mRNA的差异表达,并通过pheatmap包绘制热图,“AdjustedP<0.05且|log2FC|>1”被定义为阈值,得到的DEGs被用于后续分析。
1.3 WGCNA ......
您现在查看是摘要页,全文长 13438 字符。