基于生物信息学分析筛选结肠癌关键基因
差异基因,枢纽,1资料与方法,2结果,3讨论
崔忠泽,何 双,路丽祯,吴淑华(滨州医学院附属医院病理科,山东 滨州 256600)
结肠癌(colon cancer)在全球男性和女性恶性肿瘤发病率中分别排名第3(13.5%)和第2(9.5%)位,是严重危害人类健康的恶性肿瘤[1]。大量研究已经明确了与结肠癌预后和患者治疗反应相关的基因突变;此外,一些靶向治疗也被开发出来[2-4]。然而,结肠癌进展的确切分子机制尚不清楚,这限制了晚期疾病的治疗。因此,进一步了解结肠癌发生发展过程中的基因表达,将有助于提高诊断和治疗水平。目前,微阵列技术已被广泛用于探索癌症基因表达的变化[5,6]。高质量的芯片和高通量测序有助于发现结肠癌发生发展过程中的基因表达变化[7-9],甚至筛选出用于结肠癌诊断、治疗和预后的生物标志物。基因图谱可以从公共数据库中获得,如基因表达综合数据库(GEO)和癌症基因组图谱(TCGA),综合生物信息学方法的使用可以克服不同芯片平台和小样本量的限制。免疫疗法作为一种新兴的治疗某些癌症的方法已经获得显著的疗效[10-13]。肿瘤微环境中肿瘤细胞可以直接侵入周围组织或通过血液和淋巴管转移,并可以通过释放细胞因子引起宿主的免疫反应,直接或间接地抑制或促进肿瘤细胞的发展[14]。因此,了解肿瘤免疫微环境,寻找免疫标记物,是提高肿瘤免疫治疗效果的关键。基于此,本研究主要筛选了TCGA 数据集和4 个GEO数据集中结肠癌的共表达差异基因,并从中得到预后相关基因,分析目标基因在组织中的表达情况和功能。
1 资料与方法
1.1 数据收集 从GEO 数据库(https://www.ncbi.nlm.nih.gov/geo/)[15]中获取4 个基因芯片(GSE41657、GSE74602、GSE106582、GSE110224)。GSE41657 包含12 个结肠癌样本和25 个正常结肠组织样本。GSE74602 包含30 个结肠癌样本和30 个正常结肠组织样本。GSE106582 包含117 个结肠癌样本和77个正常结肠组织样本。GSE110224 包含17 个结肠癌样本和17 个正常结肠组织样本。从TCGA 数据库(https://portal.gdc.cancer.gov/)[16]下载结肠癌表达矩阵,包括398 个结肠癌样本和39 个正常结肠组织样本。
1.2 差异基因获取 用R 语言检测结肠癌与正常组织之间的差异基因。调整后P<0.05 和|log2FC|≥2.0认为差异有统计学意义。然后,利用在线维恩图分析网站(http://bioinformatics.psb.ugent.be/webtools/Venn/)从个以上5 个数据库中获得共同差异基因 ......
您现在查看是摘要页,全文长 10742 字符。