基于随机森林算法预测分析绝经妇女骨质疏松症关键lncRNA 及其调控作用
靶标,骨细胞,生物学,1材料与方法,1芯片数据获取,2校正处理与注释,3随机森林算法筛选关键lncRNA,4靶标基因预测,5蛋白质-蛋白质相互作用(proteinproteininter
陈敬恒 陈凯奇 何达东 石宇雄广州市番禺区中医院骨伤科,广东广州 511400
绝经妇女骨质疏松症(postmenopausal osteoporosis,PMOP)属Ⅰ型原发性骨质疏松症,主要发病机制为女性绝经后雌激素水平下降,骨量丢失,骨脆性增加,其导致的骨折会极大地增加患者的致残率、病死率,加重社会经济负担,现已成为重要的公共卫生问题[1]。PMOP 发病的本质是成骨、破骨细胞的活动发生紊乱,骨代谢平衡被打破。长链非编码RNA(long noncoding RNA,lncRNA)是不翻译蛋白质的功能性RNA 分子,参与转录调控、转录后调控、表观遗传调控等过程,对机体重要的生物学功能起到调节作用[2]。近年来随着测序技术快速发展,多项研究报道,lncRNA 可能参与调控机体骨代谢平衡[3-5],但目前lncRNA 参与调控PMOP 的分子机制尚不明确。机器学习是通过计算机模拟人类学习过程涉及的概率学、统计学、人工智能的新兴学科,被广泛应用于生物医学领域[6-7]。随机森林算法通过对分类变量进行反复迭代计算评分,生成高准确度分类器,筛选关键变量,常被作为挖掘生物标记物的重要机器学习算法[8]。本研究拟通过随机森林算法筛选PMOP 的关键lncRNA,并通过生物信息学方法预测分析靶标基因及其相关生物学过程,为PMOP 的诊断治疗提供新的靶点方向。
1 材料与方法
1.1 芯片数据获取
从基因表达数据库检索PMOP 患者芯片数据,检索时限为建库至2020 年12 月。下载GSE56815 芯片数据,该芯片基于GPL96 HG-U133A 平台检测,包括40 例PMOP 患者与40 名正常绝经后女性的测序数据。
1.2 校正处理与注释
使用R 语言oligo 软件包[9]对GSE56815 芯片数据进行RMA 基因校正标准化处理 ......
您现在查看是摘要页,全文长 7401 字符。