中国流行性腮腺炎发病率模型拟合及预测效果比较
差分,向量,1资料与方法,2结果,3讨论
刘天,姚梦雷,黄继贵,吴杨,陈琦,童叶青,陈红缨*流行性腮腺炎(以下简称“流腮”)是由腮腺炎病毒感染引起的以腮腺区肿痛、腮腺非化脓性炎症为主要临床特征的急性呼吸道传染病,儿童和青少年是其发病的主要人群[1]。流腮在全球范围内流行[2],中国流腮发病率处于较高水平[3]。流腮传染性强,常在学校、托幼机构等集体单位引起暴发流行,严重影响学校的正常教学秩序,是危害我国儿童青少年身心健康的重要公共卫生问题之一[4]。了解流腮的流行规律并准确预测其流行趋势,对卫生部门风险研判和卫生资源分配具有重要的指导意义。季节性自回归移动平均模型(SARIMA)和指数平滑模型是目前疾病预测领域应用较为广泛的定量预测方法;广义回归神经网络(GRNN)具有很强函数逼近能力,有学者将其与SARIMA进行组合用于病毒性肝炎[5]、肺结核[6]的拟合及预测,但在流腮发病率预测中的应用尚未见报道。本研究利用2004—2016年全国流腮发病率数据,分别拟合SARIMA模型、指数平滑模型、SARIMA-GRNN组合模型、指数平滑-GRNN组合模型,比较模型拟合及预测精度,为优化流腮发病率预测模型提供参考。
1 资料与方法
1.1 资料来源 2004—2016年全国流腮逐月发病率资料来源于公共卫生科学数据中心(http://www.phsciencedata.cn/)。运用全国2004年1月—2016年6月流腮逐月发病率数据分别拟合SARIMA模型、指数平滑模型、SARIMA-GRNN组合模型和指数平滑-GRNN组合模型,评价拟合效果;利用2016年7—12月流腮逐月发病率实际值验证模型预测效果。
1.2 方法
1.2.1 SARIMA模型[7]SARIMA模型一般表示为SARIMA(p,d,q)(P,D,Q)s,其中p为自回归阶数,d为一般差分阶数,q为移动平均阶数,P为季节性自回归阶数,D为季节性差分阶数,Q为季节性移动平均阶数,s为季节周期。SARIMA模型只适用于平稳时间序列,对于非平稳序列采用自然对数转换,差分和季节性差分使序列平稳。平稳性检验采用单位根(ADF)检验。SARIMA建模过程包括:(1)序列平稳化,确定d、D值。(2)模型识别,根据自相关(ACF)图、偏自相关(PACF)图特征确定p、q值;P、Q值采用凑试法筛选。(3)拟合优度检验,根据贝叶斯信息准则(BIC)、平稳的决定系数(R2)、平均绝对误差百分比(MAPE)筛选最优模型;通过t检验检验各模型中参数是否具有统计学意义;通常采用Box-Ljung统计量检验模型残差 ......
您现在查看是摘要页,全文长 10210 字符。