随机森林算法在中医药院校贫困生认定预测中的应用研究(2)
随机森林算法是由多棵决策树作为基学习器,利用Bagging生成不同的训练集,在单棵树的训练过程中引入随机属性选择,训练多次,得到多棵不同的决策树,将这些树组合成随机森林分类器。在分类时通过投票或取平均决定未知样本的类别。随机森林的构建过程见图1[11]。随机森林的构建过程中关键步骤包括:随机生成训练集、生成多棵决策树、通过投票实现算法。随机森林算法的步骤描述如下:
①从数据集中利用bootstrap抽样法有放回地随机抽样,选取每棵树的训练样本集。初始训练集中,有些数据重复出现,有些从未出现。在训练过程中,每次抽样约有63.2%的样本被抽中,作为自助样本集,用来作为训练数据构建一棵决策树;剩余的36.8%的样本称为袋外数据 ......
您现在查看是摘要页,全文长 2901 字符。