基于生物信息学及机器学习鉴定骨关节炎滑膜相关基因
差异基因,1材料与方法,2结果,3讨论
杨延辑,廖文波(1.遵义医科大学附属医院 脊柱外科,贵州 遵义 563099;2.遵义医科大学第二附属医院 骨外科,贵州 遵义 563000)
骨性关节炎(Osteoarthritis,OA)是由多种因素引起的以关节软骨退行性变,当骨关节炎发展到一定程度时形成不可逆疾病,世界上超过 10% 的人口患有OA,65岁以上人群患病率更高,OA 造成的经济和社会负担正在迅速增加,并严重影响患者的生活质量[1]。关节置换是关节炎目前终末期的主要治疗手段,其中膝骨关节炎(Knee osteoarthritis,KOA)患病率高、花费高是导致世界残疾的第四大原因[2],目前临床诊断大多靠影像学、检验学、查体等;随着社会人口的老龄化 ,该病的发生率越来越高,目前的药物治疗大多是对症的,迄今为止还缺乏改善疾病的 OA 药物[3];因此骨关节炎早期诊断、及时防治有其重要现实意义[4]。骨关节炎的发病机制目前尚不明确,以往骨关节炎的研究热点大多集中于软骨组织,现研究发现滑膜、成纤维样滑膜细胞和软骨下骨细胞也参与了骨关节炎的发病过程[5]。本研究拟通过生物信息学方法,对GEO公共数据库中有关OA滑膜的基因表达谱芯片数据进行差异表达基因分析、功能富集、尝试用机器学习的方式筛选骨关节炎关键基因,探讨OA发生发展中调节基因,为探索其诊断和治疗靶点提供生物学信息依据。
1 材料与方法
1.1 数据的下载及处理 本研究中从公共数据库GEO(GENE EXPRESSION OMNIBUS,GEO)下载骨关节炎滑膜相关芯片数据集。筛选条件为:①骨关节炎;②人类;③滑膜组织;④无药物及手术干预。基于筛选条件下载表达数据集GSE1919,GSE55235,GSE82017,GSE55457;GSE1919包含5个OA 滑膜组织样本和5个正常滑膜组织样本,GSE55235包含10个OA滑膜组织样本和10个正常滑膜组织样本,GSE82017包含10个OA滑膜组织样本和7个正常滑膜组织样本,GSE55457包含10个OA滑膜组织样本和10个正常滑膜组织样本,利用R软件读取下载相关基因的原始数据,对数据芯片进行预处理,将GSE1919,GSE55235两个数据集作为训练集进行数据合并,将GSE82017,GSE55457作为两个独立验证集,对样本中都不表达的探针、存在的缺失值或基因与多个探针存在对应关系等特殊情况,进行标准化、探针过滤、缺失值填充以及探针合并等,并对合并数据表达矩阵进行log2对数转换,对数据进行标准化处理 ......
您现在查看是摘要页,全文长 9748 字符。