组合模型对肺结核发病趋势的预测研究
迁安市,残差,传染病,1资料与方法,2结果,3讨论
陈银苹,吴爱萍,余亮科,许雅丽,蒋 宁,杨 阳,张 锦,张静宇,曹燕花肺结核是我国发病、死亡人数最多的重大传染病之一。根据2010年全国第五次结核病流行病学调查结果,估算我国全人群活动性肺结核患病率为392/10万,其中传染性肺结核患病率为100/10万。据此估算2010年我国现有活动性肺结核患者总数为523万,其中传染性肺结核患者总数为134万,占全球发病的14.3%,仅次于印度[1]。本文运用自回归积分移动平均(ARIMA)-灰色模型(GM)组合模型对迁安市2004年1月—2012年12月的肺结核逐月发病率进行拟合,并预测该市2013年肺结核逐月发病情况,以探讨使用此模型预测肺结核未来发病率,为加速防控肺结核提供依据。
1 资料与方法
1.1 资料来源 迁安市2004年1月—2012年12月肺结核的发病资料来源于中国疾病预防控制信息系统中疾病监测信息报告管理系统,相应的人口学资料来源于中国疾病预防控制信息系统的基本信息系统。
1.2 ARIMA模型
1.2.1 ARIMA模型原理 ARIMA模型是由博克思(Box)和詹金斯(Jenkins)于20世纪70年代初提出的著名时间序列预测方法,又称为Box-Jenkins模型、博克思-詹金斯法[2]。医学研究中,某些传染病的发生发展规律随时间而变化,将这组依赖于时间变化的变量称之为时间序列资料,就是依赖于时间(t)的数据,记作:Y1,Y2……Yt。如肺结核就是一种随时间而发生有规律变化的传染病,可以用t函数关系来描述其发生及变化规律。
1.2.2 建模步骤 (1)预处理数据;(2)模型的识别:采用最小二乘估计等方法对识别阶段提供的粗模型进行参数估计并假设检验,确定赤池信息量准则(AIC)值〔或贝叶斯信息准则(BIC)值〕最小的模型[3];(3)参数估计及模型诊断:模型是否合适需要对其拟合优度进行检验,如果残差序列不是白噪声序列,则需要重新建立模型,重复上述步骤直到残差序列是白噪声序列为止;(4)预测:包括点预测和区间预测。
1.3 GM(1,1)模型
1.3.1 GM(1,1)模型原理 灰色系统理论是我国学者邓聚龙教授于19世纪80年代初提出的,主要内容包括以灰色朦胧集为基础的理论体系,以灰色关联空间为依托的分析体系,以灰色序列生成为基础的方法体系,以GM为核心的模型体系,以系统分析、评估、建模、预测、决策、控制、优化为主体的技术体系。GM(1,1)模型的核心思想是利用离散随机数经过生成(其中包括累加、累减生成、均值生成等)变为随机性被显著削弱而且较有规律的生成数 ......
您现在查看是摘要页,全文长 11657 字符。