需要金币:![]() ![]() |
资料包括:完整论文 | ![]() |
![]() |
转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:11008 | ![]() | |
折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) | ![]() |
内容摘要:随着互联网的普及与网络社交的快速发展,越来越多的人们在诸多领域上发表自己的评论,比如观看电影后发表影评,网购商品后发表评价,旅游后对景点发表评论等。由此产生了大量的文本评论,而这些评论数据中蕴藏着丰富的可挖掘信息。通过人工阅读的方式,从海量的评论数据中发现有效信息是一件非常困难的事情,因此运用文本分析的方法研究在线评论是必要的。 通过研究《说唱新世代》节目的在线评论,以观众对《说唱新世代》的观看感受,探索观众对于这档说唱类综艺制作内容以及说唱音乐的讨论关注点,以此得出说唱类综艺节目如何吸引观众,说唱音乐如何更好地吸引听众。 通过收集节目的评论数据,分别利用词频和基于TF-IDF的词频进行分析初步得到观众讨论最多的方面有参赛选手,制作方人员,作品,内容,外部背景。再运用LDA主题模型得出观众讨论的有节目的总体配置,选手及节目制作组的实力,与同类的主要区别,节目中的突出选手和选手作品表达的内容五个主题。最终结合所有的分析结果,得出结论并给出相应的建议。
关键词:在线评论;词频;TF-IDF;LDA主题模型
目录 摘要 Abstract 1绪论-1 1.1研究背景与目的-1 1.1.1研究背景-1 1.1.2研究目的与意义-1 1.2研究内容-2 1.3创新点-2 2研究现状-3 2.1文献综述-3 2.2研究现状-3 3相关理论知识与技术阐释-5 3.1TF-IDF-5 3.2LDA主题模型-5 4评论数据准备与处理-7 4.1数据采集-7 4.2评论文本预处理-8 4.2.1分词-9 4.2.2去停用词-9 5统计分析与模型建立-11 5.1统计分析-11 5.1.1词频统计分析-11 5.1.2基于TF-IDF的词频可视化-12 5.2基于LDA模型的主题建模-13 5.2.1确定主题数目-13 5.2.2LDA模型优化-14 5.2.3LDA模型建立-15 6研究总结与展望-17 6.1研究结论-17 6.2建议-17 6.3研究不足与展望-17 参考文献-19 致谢 |