基于数据挖掘技术对2型糖尿病肾病进展的影响因素分析
降糖,1材料与方法,1数据来源,2数据挖掘预处理,3数据挖掘软件和统计软件,4数据挖掘步骤,2结果,1基本信息,2数据挖掘挖掘结果,3讨论,4结论
余萍,刘欢,李刚*(.四川省医学科学院·四川省人民医院药学部,成都 6007;.四川省交通运输厅公路局医院,成都 673)我国2 型糖尿病(T2DM)患者血糖达标率仅为47.7%[1],导致我国约20%~40%的糖尿病患者合并糖尿病肾病[2],糖尿病已成为慢性肾疾病和终末期肾病进展的主要原因[3]。对T2DM 肾病进展的影响因素进行全面分析,针对性地加强重要影响因素的自我管理,是提高血糖控制率、延缓糖尿病肾病进展的重要手段[4]。由于糖尿病肾病患者年龄、病程、降糖方案未调整时间等个体差异大,降糖药物种类多、用药方案复杂,影响因素变量多,不易分析,且多种影响因素间可能存在交互作用,传统基于概率论与数理统计的方法难以甄别关键因素。本研究通过数据挖掘技术结合数理统计,研究影响T2DM 肾病进展的重要因素以及重要因素之间的关系,并建立糖尿病肾病进展的预测模型,为T2DM患者的个体化管理提供证据支持,为糖尿病肾病影响因素全面分析和预测研究的模式提供新思路。
1 材料与方法
1.1 数据来源
本研究为患者长期使用降糖药物控制血糖的T2DM 肾病进展的真实世界研究,研究数据为2010年1月-2015年12月在四川省人民医院住院并经明确诊断的T2DM,超过1年未监测血糖也未改变过用药方案的166例T2DM 患者的数据。剔除了重复住院者、肝脏功能不全者、在住院日期起12 个月内访问过任何医疗机构(药店除外)的患者、非化学药物治疗T2DM 者(包括未接受治疗者,接受过减肥手术、针灸、中药等治疗的患者)。由两名研究者独立完成病例筛选及提取数据,保障数据的准确性、完整性、一致性,并隐藏患者的姓名、电话号码、家庭住址等隐私信息,保障患者数据安全。每个病例包括患者基本信息(性别、年龄、遗传史、病程等)、用药行为(包括用药数量、种类、降糖方案未调整时间等)、血糖控制情况及肾功能等主要内容。
1.2 数据挖掘预处理
结合医药专业知识对原始数据进行填充、归约、清洗,将用于构建模型的数据转换为统一格式。阅读病历根据医药专业知识填充缺失值,设定缺失值范围,根据矩阵算法填充最可能的值缺失值;根据肾小球滤过率(eGFR)对慢性肾脏病(CKD)分期[5]并对肾功能分级;根据2017ADA[6]不同糖化水平联用药物的标准对糖化血红蛋白分级;根据2016 中国成人血脂异常防治指南[7]对血脂异常分级;考虑糖尿病发病进展情况[4] ......
您现在查看是摘要页,全文长 9583 字符。