基于知识学习挖掘乳腺癌与甲状腺癌的共享功能模块和核心基因
癌症,通路,1资料与方法,2结果,3讨论
许德华,陈晓琳,廖苑君,蓝树金,孙胜南,李 让,饶绍奇(广东医科大学公共卫生学院1,医学系统生物学研究所2,广东 东莞 523808)
乳腺癌(breast cancer,BC)和甲状腺癌(thyroid cancer,TC)是我国常见的女性恶性肿瘤。BC 年发病数约为30.4 万,位于女性恶性肿瘤发生首位[1]。TC年发病数约为15.10 万,位于女性恶性肿瘤发生第4位[1]。BC与TC 的发病率都呈逐年上升趋势[2,3],且根据以往研究报道[4],TC 或BC 患者发生第2 原发BC或TC 的风险相对更高。我国2001-2010 年调查研究发现[5,6],患BC 的女性未来患TC 的可能性是普通人的2 倍,而患TC 的女性未来患BC 的几率比普通人群高67%。研究显示[7,8],BC 患者一级亲属患TC的风险更高,提示BC 和TC 之间可能存在某种家族联系。有研究显示[9],BC 和TC 这两种癌症都受下丘脑-垂体-腺体轴调控,与性别、环境、药物治疗以及遗传等因素有关,但根本原因尚未明确。因此,本研究基于基因多效性理论,利用转录组数据结合生物学网络分析方法挖掘两种疾病的共享功能模块及核心致病基因,为揭示两种癌症发病的关联机制提供新思路,现报道如下。
1 资料与方法
1.1 数据来源 从TCGA 数据库(https://tcga-data.nci.nih.gov/tcga/)中分别下载BC 和TC 的RNA-seq数据和临床资料。样本剔除标准:①重复测量样本;②临床信息缺失样本。异常表达基因剔除标准:表达值在80%的样本中均少于0 的基因。生物分子网络的构建利用人类蛋白质参考数据库[10](Human Protein Reference Database,HPRD)中的蛋白质互作关系(protein-protein interaction,PPI)。
1.2 共享风险基因的筛选 利用“edgeR”R 软件包对BC 和TC 的RNA-seq 数据分别进行差异分析,以FDR 校正后P<0.05 且|logFC|>1 为标准筛选差异表达基因(differentially expressed genes,DEGs)。最后,利用韦恩图对BC 和TC 的DEGs 按共同上、下调取交集 ......
您现在查看是摘要页,全文长 8880 字符。