当前位置: 首页 > 期刊 > 《医药产业资讯》 > 2017年第14期
编号:13051448
随机森林算法在中医药院校贫困生认定预测中的应用研究(2)
http://www.100md.com 2017年5月15日 《中国医药导报》 2017年第14期
     随机森林算法是由多棵决策树作为基学习器,利用Bagging生成不同的训练集,在单棵树的训练过程中引入随机属性选择,训练多次,得到多棵不同的决策树,将这些树组合成随机森林分类器。在分类时通过投票或取平均决定未知样本的类别。随机森林的构建过程见图1[11]。

    随机森林的构建过程中关键步骤包括:随机生成训练集、生成多棵决策树、通过投票实现算法。随机森林算法的步骤描述如下:

    ①从数据集中利用bootstrap抽样法有放回地随机抽样,选取每棵树的训练样本集。初始训练集中,有些数据重复出现,有些从未出现。在训练过程中,每次抽样约有63.2%的样本被抽中,作为自助样本集,用来作为训练数据构建一棵决策树;剩余的36.8%的样本称为袋外数据 ......
上一页1 2 3下一页

您现在查看是摘要页,全文长 2901 字符