几种分类算法的应用与比较.docx

资料分类:精选论文 上传会员:螺蛳粉50g 更新时间:2024-01-20
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:8984
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:乳腺肿瘤是一种常见的乳腺疾病, 有良性与恶性之分, 针对不同的类型治疗方法和强度不同, 使用的药物不同, 因此研究乳腺肿瘤的类别并对乳腺肿瘤进行正确的分类具有现实意义. 本文首先依次介绍了KNN(K Nearest Neighbors)算法、逻辑斯谛回归模型、决策树、随机森林这四种分类算法, 接着采用这四类方法对UCI数据库上关于乳腺肿瘤的数据进行分析, 得出分类结果, 最后将这四种方法在乳腺肿瘤数据集上的分类效果做了对比, 结果表明逻辑斯谛回归是针对此乳腺肿瘤数据集分类效果最好的算法.

关键词:  乳腺肿瘤 KNN 逻辑斯谛回归 决策树 随机森林

 

目录

摘要

Abstract

1.引言-1

1.1研究背景及研究现状-1

1.2实施思路-2

2.分类算法-2

2.1KNN-2

2.1.1基本含义-2

2.1.2优缺点-4

2.2逻辑斯谛回归-4

2.2.1基本含义-4

2.2.2优缺点-5

2.3决策树-6

2.3.1基本含义-6

2.2.2优缺点-7

2.4随机森林-8

2.4.1基本含义-8

2.4.2优缺点-10

2.5模型评估准则-10

3. 实证-11

3.1数据描述-11

3.2乳腺肿瘤数据基于KNN算法的数据分析结果-13

3.2.1分析过程-13

3.2.2预测结果-13

3.3乳腺肿瘤数据基于逻辑斯谛回归的数据分析结果-14

3.3.1分析过程-14

3.3.2预测结果-15

3.4乳腺肿瘤数据基于决策树的数据分析结果-16

3.4.1分析过程-16

3.4.2预测结果-17

3.5乳腺肿瘤数据基于随机森林的数据分析结果-19

3.5.1分析过程-19

3.5.2预测结果-19

3.6四种算法结果对比分析-20

4.总结与展望-21

参考文献-22

附录-23

致谢-27

相关论文资料:
最新评论
上传会员 螺蛳粉50g 对本文的描述:随机森林是通过集成多个弱分类器而成, 由Leo Breiman和Adele Cutler提出, 以少数服从多数的方法构成判断结果. 随机森林的“随机”有两个方面, 一是选取训练样本集的随机, 二是选取分类指......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: