基于LDA模型的《说唱新世代》评论文本分析.docx

资料分类:精选论文 上传会员:裂缝之外 更新时间:2024-02-04
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:11008
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

内容摘要:随着互联网的普及与网络社交的快速发展,越来越多的人们在诸多领域上发表自己的评论,比如观看电影后发表影评,网购商品后发表评价,旅游后对景点发表评论等。由此产生了大量的文本评论,而这些评论数据中蕴藏着丰富的可挖掘信息。通过人工阅读的方式,从海量的评论数据中发现有效信息是一件非常困难的事情,因此运用文本分析的方法研究在线评论是必要的。

通过研究《说唱新世代》节目的在线评论,以观众对《说唱新世代》的观看感受,探索观众对于这档说唱类综艺制作内容以及说唱音乐的讨论关注点,以此得出说唱类综艺节目如何吸引观众,说唱音乐如何更好地吸引听众。

通过收集节目的评论数据,分别利用词频和基于TF-IDF的词频进行分析初步得到观众讨论最多的方面有参赛选手,制作方人员,作品,内容,外部背景。再运用LDA主题模型得出观众讨论的有节目的总体配置,选手及节目制作组的实力,与同类的主要区别,节目中的突出选手和选手作品表达的内容五个主题。最终结合所有的分析结果,得出结论并给出相应的建议。

 

关键词:在线评论;词频;TF-IDF;LDA主题模型

 

目录

摘要

Abstract

1绪论-1

1.1研究背景与目的-1

1.1.1研究背景-1

1.1.2研究目的与意义-1

1.2研究内容-2

1.3创新点-2

2研究现状-3

2.1文献综述-3

2.2研究现状-3

3相关理论知识与技术阐释-5

3.1TF-IDF-5

3.2LDA主题模型-5

4评论数据准备与处理-7

4.1数据采集-7

4.2评论文本预处理-8

4.2.1分词-9

4.2.2去停用词-9

5统计分析与模型建立-11

5.1统计分析-11

5.1.1词频统计分析-11

5.1.2基于TF-IDF的词频可视化-12

5.2基于LDA模型的主题建模-13

5.2.1确定主题数目-13

5.2.2LDA模型优化-14

5.2.3LDA模型建立-15

6研究总结与展望-17

6.1研究结论-17

6.2建议-17

6.3研究不足与展望-17

参考文献-19

致谢

相关论文资料:
最新评论
上传会员 裂缝之外 对本文的描述:通过收集《说唱新世代》综艺节目的评论文本,再使用文本分析的方法对这些文本数据进行挖掘分析,以观众对《说唱新世代》的观看感受,探索观众对于这档说唱类综艺制作内容以及......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: