需要金币:![]() ![]() |
资料包括:完整论文 | ![]() |
![]() |
转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:7323 | ![]() | |
折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) | ![]() |
摘要:各大视频网站用户规模越来越壮大,用户热衷于通过弹幕这种线上互动方式表达自己的观点。目前大多视频网站都关注用户兴趣,口碑和评分等等,鲜少从用户的情感层面进行深度挖掘。运用情感分析算法挖掘弹幕评论,可以获得文本表达的褒贬情况。为决策者提供数据方面的信息。
本文采用TF-IDF与SVM模型,对B站平台弹幕进行情感分析相关研究。本人首先利用python爬取了1000条弹幕,通过调用百度开放平台情感分析api计算弹幕的情感极性后,将正向情感标记为1,负向情感标记为0。接着用TF-IDF模型对弹幕进行文本向量化,按照8:2的比例划分训练集和测试集,用SVM算法对其进行情感分类。实验结果显示,提出的SVM模型较其他模型相比能达到更好的准确值。
关键词: 情感分析 弹幕文本挖掘 TF-IDF SVM
目 录
摘 要
Abstract
1.引言-1
1.1背景-1
1.2情感分析研究的目的与意义-1
1.3 情感分析研究现状-1
2.相关技术-3
2.1网络爬虫-3
2.2情感分析-3
3.实验数据的获取与预处理-5
3.1哔哩哔哩网站-5
3.2弹幕爬取-5
3.3百度aip情感分析-5
3.4文本预处理-6
3.4.1 弹幕分词:技术及例子-6
3.4.2 停用词处理-7
4.模型-8
4.1文本向量化-8
4.2 SVM模型-8
5.实验结果-10
5.1实验数据-10
5.2.数据可视化-11
5.3 SVM模型结果分析-13
5.4实验对照-14
6.结论及展望-16
6.1结论-16
6.2展望-16
参考文献-17 |