当前位置: 首页 > 期刊 > 《中国医药导报》 > 2021年第30期
编号:508594
基于随机森林算法预测分析绝经妇女骨质疏松症关键lncRNA 及其调控作用
http://www.100md.com 2021年11月27日 中国医药导报 2021年第30期
靶标,骨细胞,生物学,1材料与方法,1芯片数据获取,2校正处理与注释,3随机森林算法筛选关键lncRNA,4靶标基因预测,5蛋白质-蛋白质相互作用(proteinproteininter
     陈敬恒 陈凯奇 何达东 石宇雄

    广州市番禺区中医院骨伤科,广东广州 511400

    绝经妇女骨质疏松症(postmenopausal osteoporosis,PMOP)属Ⅰ型原发性骨质疏松症,主要发病机制为女性绝经后雌激素水平下降,骨量丢失,骨脆性增加,其导致的骨折会极大地增加患者的致残率、病死率,加重社会经济负担,现已成为重要的公共卫生问题[1]。PMOP 发病的本质是成骨、破骨细胞的活动发生紊乱,骨代谢平衡被打破。长链非编码RNA(long noncoding RNA,lncRNA)是不翻译蛋白质的功能性RNA 分子,参与转录调控、转录后调控、表观遗传调控等过程,对机体重要的生物学功能起到调节作用[2]。近年来随着测序技术快速发展,多项研究报道,lncRNA 可能参与调控机体骨代谢平衡[3-5],但目前lncRNA 参与调控PMOP 的分子机制尚不明确。机器学习是通过计算机模拟人类学习过程涉及的概率学、统计学、人工智能的新兴学科,被广泛应用于生物医学领域[6-7]。随机森林算法通过对分类变量进行反复迭代计算评分,生成高准确度分类器,筛选关键变量,常被作为挖掘生物标记物的重要机器学习算法[8]。本研究拟通过随机森林算法筛选PMOP 的关键lncRNA,并通过生物信息学方法预测分析靶标基因及其相关生物学过程,为PMOP 的诊断治疗提供新的靶点方向。

    1 材料与方法

    1.1 芯片数据获取

    从基因表达数据库检索PMOP 患者芯片数据,检索时限为建库至2020 年12 月。下载GSE56815 芯片数据,该芯片基于GPL96 HG-U133A 平台检测,包括40 例PMOP 患者与40 名正常绝经后女性的测序数据。

    1.2 校正处理与注释

    使用R 语言oligo 软件包[9]对GSE56815 芯片数据进行RMA 基因校正标准化处理 ......

您现在查看是摘要页,全文长 7401 字符