需要金币:![]() ![]() |
资料包括:完整论文 | ![]() |
![]() |
转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:18129 | ![]() | |
折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) | ![]() |
摘要:分类一直是数据科学界研究的重点问题,它被广泛地应用到生活的各个方面。伴随着电商行业的快速发展,商品的数量日益庞大,需要对商品制定分类,便于消费者找寻自己所需的商品。如果仍然采用传统方法人工去为商品分类,不仅工作量巨大、速度慢,而且容易出现将商品分类到不正确的类别的情况。因而通过利用自动化工具代替人工进行商品分类的流程是大势所趋。 机器学习领域发展至今整个体系已比较完善,各种分类算法已趋于成熟,并广泛应用于各个领域。不同分类算法由于其自身原理适用场景也略有差异,导致分类效果也参差不齐。传统分类算法是否适用于大数据量的商品文本分类。准确率,效率如何则成为衡量一个算法的关键数据。本文针对实现大数据量商品文本分类算法所做工作如下。 1.为了获取时下各大电商网站关于商品的准确信息,避免因为数据的不准确从而影响分类效果。利用爬虫工具,爬取各大电商网站的商品名称及对应商品类别信息作为本论文所选课题商品分类系统的训练和测试数据集。 2.将数据统一处理后,应用多项式朴素贝叶斯,支持向量机与逻辑回归算法等传统分类算法,对商品数据进行分类。 3.通过对比多项式朴素贝叶斯,支持向量机与逻辑回归算法等传统分类算法,对于商品数据的分类效果,不断调试优化各项参数,选择出最适用于商品分类的算法。 4.根据算法设计商品分类原型系统。
关键词:文本分类;商品标签;多分类
目 录 摘 要 ABSTRACT 第一章 绪论-1 1.1 选题背景-1 1.2 选题意义-1 1.3 研究现状-1 1.4 研究思路-2 1.5 社会可行性-2 1.6 论文的组织结构-3 第二章 分类算法概述-4 2.1 分类算法发展史概述-4 2.2 传统算法概述-5 2.2.1 朴素贝叶斯算法-5 2.2.2 决策树(Decision Tree)-6 2.2.3 支持向量机(SVM)-7 2.2.4 KNN邻近算法-9 2.2.5 逻辑回归(Logistic Regression)-10 2.2.6 神经网络(Neural Network)-10 第三章 算法总体设计与组织方案-12 3.1 开发框架-12 3.1.1 常用机器学习框架简介-12 3.1.2 开发框架选择-12 3.2 开发环境与技术简介-13 3.3 分类器功能设计-14 第四章 算法实施方案-17 4.1 算法简述-17 4.2 算法实现流程-17 4.3 数据处理-17 4.4 特征向量化-19 4.5 算法模型训练-21 4.5.1 朴素贝叶斯-21 4.5.2 支持向量机(SVM)-23 4.5.3 逻辑回归-24 4.5.3 CNN神经网络-25 4.6 算法分类测试-26 第五章 系统总体设计与实施方案-28 5.1 系统架构与环境-28 5.2 移动智能终端-30 参考文献-33 致 谢-34 附 录-35 |