微博热评的数据挖掘与分析.docx

资料分类:计算机信息 上传会员:小七想说话 更新时间:2022-10-23
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:15699
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:随着科技的高速发展,网络信息数据呈爆炸式增长。云计算、物联网、人工智能以及大数据等也逐渐成为热门话题。对数据的有效处理及利用成为了人们关注的焦点。微博作为一种分享信息、传播信息以及获取信息的网络平台,它能够实现实时分享、传播、交流多种类型的信息,包括文字、链接、视频、图片以及表情符号等。微博上广泛的信息包含了大量有用数据,对微博数据的分析及有效的应用是国内外网络信息处理的热点。

本设计的研究目标是通过对微博热门话题的内容进行挖掘,获取当下用户关注的热点话题及话题下用户的有效文本评论,利用自然语言处理技术对文本进行情感分析获得情感极性并形成词云,以可视化状态展示给用户。本设计采用的开发工具是Pycharm,利用python语言实现数据获取、数据预处理、数据建模等一系列操作。

本设计基本实现了对微博热评的数据挖掘与分析,微博每天产生地大量的即时信息,通过挖掘与分析以可视化状态展示,对个人、企业乃至政府的决策有极大的使用价值,对微博中舆情控制、解决热门问题有重大意义。

 

关键词:微博话题挖掘;情感分析;自然语言处理

 

目录

摘要

Abstract

第1章 前言-1

1.1研究背景-1

1.2国内外研究现状-1

1.2.1国外研究现状-1

1.2.2国内研究现状-2

1.3研究目的及意义-2

1.4全文组织结构-2

第2章 python数据挖掘概述-4

2.1数据挖掘综述-4

2.2 python数据挖掘综述-5

2.3 数据挖掘算法-5

2.3.1 K-means算法-5

2.3.2 SVM算法-6

2.3.3决策树算法-6

2.3.4人工神经网络算法-6

2.4数据预处理简介-7

2.4.1数据清理-7

2.4.2数据集成-8

2.4.3数据变换-8

2.4.4数据归约-8

2.5数据建模简介-8

第3章 python网络爬虫技术概述-10

3.1 API简介-10

3.2网络爬虫技术简介-10

3.4常用python类库-11

3.4.1 Requests库-11

3.4.2 Pandas库-11

3.4.3 Matplotlib库-11

3.4.4 Jieba 分词库-11

第4章 情感分析及关键技术-13

4.1情感词量化-13

4.2情感极性分析-13

4.3 NLP分类算法简介-13

4.3.1 snownlp类库简介-14

4.3.2朴素贝叶斯算法-15

第5章 数据可视化概述-17

5.1数据可视化简介-17

5.2可视化工具-17

第6章 基于数据挖掘的微博热门话题情感分析-18

6.1微博热门话题情感分析综述-18

6.2数据挖掘工具-18

6.3数据来源-18

6.4数据获取-19

6.5数据预处理-24

6.6 snownlp类库情感极性分析-24

6.7词频分析-26

第7章 总结与展望-28

7.1总结-28

7.2展望-28

参 考 文 献-29

致  谢-31

相关论文资料:
最新评论
上传会员 小七想说话 对本文的描述:“热点话题”作为微博中社会热点事件来源的重要模块,受到众多微博用户的关注。这些热点问题正是大众关注的问题,微博用户通过一次次转发评论,产生了大量带有主观色彩的数据......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: