当前位置: 首页 > 期刊 > 《医学信息》 > 2022年第4期
编号:448459
肺癌患者检验项目数据可视化及关联分析
http://www.100md.com 2022年3月11日 医学信息 2022年第4期
压积,项集,红细胞,1开发语言与环境,2数据采集,3数据预处理,4数据集生成,5数据可视化,6关联分析,7总结
     王晓东,孙安琪,赵托亚,李佳欣,吴雅琴

    (内蒙古医科大学计算机信息学院,内蒙古 呼和浩特 010110)

    健康医疗大数据已被国家列为重要的基础性战略资源进行大力发展和推进[1]。健康医疗大数据中蕴含着大量非常有价值的信息,但是目前很多医疗卫生机构还没有将这些大数据充分利用起来,无法完全发掘数据的潜在价值,导致数据资源浪费。如何让服务器中的数据发挥作用,这是很多管理者和科研工作者需要面对的问题。此外,目前对于疾病的诊断与治疗很多情况下依赖于临床医师的经验,缺乏大量历史病例提供的数据参考。根据国家癌症中心发布的最新全国癌症统计数据显示,肺癌位居我国恶性肿瘤发病首位,死亡率最高[2],大约每5 位癌症死亡患者中就有1 位死于肺癌[3]。肺癌预后较差,在我国人群中其5 年生存率仍不超过20%[4],其诊治产生的医疗费用对患者家庭和社会造成了严重负担。检验项目是可以反映疾病变化的重要检测手段。探索检验项目复杂组合与疾病之间的联系,有利于优化治疗措施,避免患者承受更大的痛苦[5]。本研究针对肺癌患者在医院诊疗期间检验项目数据进行采集、处理以及可视化,以图形、图表形式直观呈现数据结果。使用FP-growth 算法构建FP 树,对数据集进行关联分析,递归挖掘频繁项集,抽取肺癌患者检验项目中相关数据实体及各实体间关系。

    1 开发语言与环境

    本研究使用Python 程序设计语言对数据集进行处理分析,Python 版本3.8.2,采用Anaconda3 5.1.0(64-bit)的Jupyter Notebook 作为开发环境,导入xlrd、jieba、matplotlib、wordcloud、numpy、pandas、sklearn 等包完成Excel 数据读取、分词、绘图、词云图、科学计算、统计、机器学习等功能。

    2 数据采集

    以某医院诊断结果为肺癌、肺癌术后、肺癌术后化疗、肺癌转移、肺癌晚期的54 例患者,在医院诊疗期间(2017 年10 月16 日-2018 年10 月15 日)的检验项目数据作为研究对象 ......

您现在查看是摘要页,全文长 8166 字符