当前位置: 首页 > 期刊 > 《中国全科医学》 > 2013年第13期
编号:913519
使用R语言对两种结核病发病预测模型的对比分析
http://www.100md.com 2013年4月19日 中国全科医学 2013年第13期
灰色,神经网络,1资料与方法,2结果,3讨论
     汪 洋,胡代玉,杨德香,刘 瑛,王润华,易 静

    2000年全国结核病流行病学调查显示,我国目前约有5.5亿人感染了结核分枝杆菌,我国现有活动性肺结核病患者约450万人,每年新增结核病患者约150万人,每年死于结核病的患者约有25万,仍为各类传染病之首[1]。根据结核病变化规律建立结核病疫情发展预测模型,逼近准确的结核发病率,可以量化对结核的控制和管理的决策,是有效的结核病防治工作的前提。本研究采用免费开源的R语言中的神经网络分析模型和灰色模型进行结核病发病情况的分析与预测,现报道如下。

    1 资料与方法

    1.1 一般资料 资料来源于重庆市结核病防治所1993—2009年的结核病发病登记数据。

    1.2 研究方法

    1.2.1 R语言程序 R是由AT&T贝尔实验室所创的s语言发展出的有着统计分析及强大作图功能的软件系统。R语言内含的作图函数能将产生的图片展示在一个独立的窗口中,并能将之保存为各种形式的文件(jpg、png、bmp、ps、pdf、emf、pictex、xfig,具体形式取决于操作系统)。统计分析的结果也能直接显示出来,一些中间结果(如P值、回归系数、残差等)既可保存到专门的文件中,也可以直接用作进一步的分析[2]。与SPSS、MATLAB等相比,R作为一个开源的免费软件,其价值得到不断的延伸,主要表现在:可以跨平台运行,对矩阵的操作强大而高速,拥有许多可用的附加包,灵活的编程环境,对于已经广泛使用的统计软件是可兼容的[3]。

    1.2.2 BP神经网络的建模过程 BP神经网络通常有一个或多个sigmoid隐层和线性输出层,能够对具有有限个不连续点的函数进行逼近[4]。其学习过程由两部分组成:正向传播与反向传播。正向传播让输入信息在相应权值、阈值和激活函数的作用下传递到输出层,当输出的结果和期望值的误差大于给定精度时,则将误差反向传播。在误差返回过程中,网络修正各层的权值和阈值。如此反复迭代,最后使传递信号的误差达到允许精度。模型的设计包括:网络类型及层数的确定;输入及输出变量的选择;隐含层神经元数目的确定;激活函数的选择 ......

您现在查看是摘要页,全文长 7904 字符