需要金币:![]() ![]() |
资料包括:完整论文 | ![]() |
![]() |
转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:7183 | ![]() | |
折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) | ![]() |
摘要:在这数据量成几何增长的今天,传统的信息处理方式已经不能满足现在电商销售平台的需要,信息处理的方式发生了显著的变化,为了应对成几何增长的数据量,人们开始着手大数据的研究,京东的手机销售数据极其巨大,传统的数据处理方式往往不能满足在实时决策方面的需求,开发基于Hadoop生态圈的平台是必然形式。 京东手机销售数据统计系统采用的是典型的B/S结构(Browser/Server,浏览器/服务器模式)系统,以Windows为操作系统平台,也可在Linux上进行浏览,本平台是部署在Hadoop生态圈上,在开发之前需要将Hadoop系统部署在Linux平台之上,当开发这个平台时,以HTML为基础的前端,使用Echarts插件作为前端数据可视化的显示的辅助,以MySQL和HBase为数据库,在 Eclipse 工具上开发了一款适合京东使用的手机销售平台。 这个平台主要功能查看电商平台数量,手机销售数量,数据仓库中数据存储的总数目、买家会员等级情况、卖家印象统计、评论来源扇形图、全国区域销售量分布等。上述所有查看信息均以图表形式展示,以折线图、地域分布图、条形图、扇形图分别展示,使数据更加直观,在数据直观的情况下可以帮助人们以最快的速度进行决策。
关键词:Hadoop;Java;大数据;数据分析
目录 摘要 Abstract 1 技术可行性研究与功能需求分析-1 1.1 技术可行性分析-1 1.2 功能需求分析-1 1.3 性能需求-2 1.3.1数据的完整性-2 1.3.2可扩展性和可维护性-2 1.3.3可扩展性和可维护性-3 2 平台设计-4 2.1 相关技术介绍-4 2.2伪Hadoop集群的系统环境与节点规划-4 2.2.1搭建Hadoop生态圈系统要求-4 2.2.2伪集群服务器节点规划-5 2.2.3配置 Hadoop 分布式集群环境-5 2.3系统总体框架设计-5 2.3.1基本操作-5 2.3.2 买家信息展示模块-6 2.3.3买家信息提取模块-7 3 系统的实现-8 3.1 买家信息展示模块的实现-8 3.1.1首页上端部分-8 3.1.2信息的来源展示-8 3.1.3评论来源平台展示-9 3.1.4用户会员等级分布情况-9 3.1.5买家印象统计-10 3.1.6全国手机销售信息来源-11 3.2 买家信息提取模块的实现-11 3.2.1运营商数据统计-11 3.2.2绘制手机画像-12 3.2.3手机销量排名统计部分-12 3.2.4不同等级会员购买力统计展示-13 4 系统测试-15 4.1 Hadoop生态圈的测试-15 4.2 数据分析平台的测试-16 结 论-17 参 考 文 献-18 致 谢-19 |