当前位置: 首页 > 期刊 > 《中国药物经济学》 > 2019年第5期
编号:1394769
应用半监督生成对抗网络预测 临床试验中严重不良事件
http://www.100md.com 2019年6月6日 中国药物经济学 2019年第5期
构架,样本,1半监督学习,2半监督生成对抗网络模型,1生成对抗网络,2半监督生成对抗网络构架,3数据介绍,4实验结果,5讨论
     Yong Cai

    随着深度学习技术的突破,以及大数据时代到来,深层神经网络的相关应用在在各行各业中逐渐普及[1]。深度学习在模式识别,事件预测和点到点的自动化方面取得了突破性的成绩。但是和深层网络相关的模型在性能上很大程度依赖于是否存在大量有标识的学习样本。在小样本空间中,深层网络的实际应用非常困难,很难训练出相对精确的预测模型。在医疗行业中,这一现象尤为明显。如何克服 样本数量的局限,利用数据库中大量未标识数据来帮助训练和提高预测模型的精准性是医疗行业中长期以来的一个重要话题。比方说,在罕见疾病的诊断与预测上,确诊与标识的罕见病人数非常少,绝大部分患者在训练数据中都是未标识的[2]。例如在2018年国家卫生和环境卫生委员会等五部门联合制定的《第一批罕见病目录》中遗传性血管性水肿确诊率仅为1/50 000[3]。很多患者在得病初期都是没有征兆的,加上医生对罕见疾病的陌生,导致这部分病人的延迟诊断和治疗。在数据库中,存在很多这些类似的未标识样本。传统方法很难有效利用这些未标识病人的诊断和治疗历史来建模。

    我们主要探讨使用最新开发的半监督生成对抗网络预测临床药物试验中产生严重不良事件(SAE)的问题。临床试验中的不良事件是指受事病人在使用药物后出现非期望的医疗事件。不良事件的发生对受试者和药物研发单位会造成灾难性的后果。如何预测和避免严重不良事件发生是一个重要的研究话题。我们主要从数据挖掘和模型角度来探讨这个问题。从我们采集到的数据,可以观测到参与临床试验的医生发生不良事件的历史记录,实验的药物化学结构,所治疗病人的诊疗历史。和以上提到的罕见疾病相类似,参预药物临床试验的医生的样本数又相对较少,其中发生严重不良事件更是罕见。小样本再加上数据极端不均衡性,给预测模型的精确性带来极大困难。另一方面,我们又观测到了大量未参与临床试验的医生和病人的数据。这些病人和相关医生含有丰富的诊疗历史信息,我们能否利用这些来帮助我们训练小样本不良事件的预测模型呢?

    最近,在人工智能领域开发出的半监督生成对抗网络正是适合解决小标识样本但是存在未标识大样本的机器学习问题[4-5]。我们前面提到的预测临床药物试验中不良事件正好符合这一类问题的特性。实验结果显示,半监督生成对抗网络显著提高了不良事件预测的准确性 ......

您现在查看是摘要页,全文长 8762 字符