Hadoop技术优缺点详解

作者 : 开心源码 本文共1108个字,预计阅读时间需要3分钟 发布时间: 2022-05-13 共200人阅读

给大家详情一下关于Hadoop技术的优缺点,目前我们正被数据包围,全球43亿部电话、20亿位互联网客户每秒都在不断地产生大量数据,人们发送短信给朋友、上传视频、用手机拍照、升级社交网站的信息、转发微博、点击广告等,使得机器产生和保留了越来越多的数据。数据的指数级增长对处于市场领导地位的互联网公司,如Facebook、谷歌、雅虎、亚马逊、腾讯等提出了挑战。它们需要对TB级别和PB级别的数据进行分析解决,以发现哪些网站更受欢迎,哪些商品更具备吸引力,哪些广告更吸引客户。传统的工具对于解决如此规模的数据集越来越无能为力。

现在,Hadoop应运而生,庞大的信息流有了新的解决平台。今天给大家分享下Hadoop技术的优缺点。

1、Hadoop的优点

(1)Hadoop具备按位存储和解决数据能力的高可靠性。

(2)Hadoop通过可用的计算机集群分配数据,完成存储和计算任务,这些集群可以方便地扩展到数以千计的节点中,具备高扩展性。

(3)Hadoop能够在节点之间进行动态地移动数据,并保证各个节点的动态平衡,解决速度非常快,具备高效性。

(4)Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配,具备高容错性。

2、Hadoop的缺点

(1)Hadoop不适用于低推迟数据访问。

(2)Hadoop不能高效存储大量小文件。

(3)Hadoop不支持多客户写入并任意修改文件。

Hadoop的核心组件

3、Hadoop版本简介:

Hadoop自诞生以来,主要出现了Hadoop1、Hadoop2、Hadoop3三个系列多个版本。

HDFS和MapReduce是Hadoop1的核心组件,Hadoop生态圈里的很多组件都是基于HDFS和MapReduce发展出来的。在继Hadoop1之后出现了Hadoop2,Hadoop2在Hadoop1的基础上做了改进。相比Hadoop1,Hadoop2的三大核心组件分别是HDFS、MapReduce、Yarn。目前市面上绝大部分企业使用的是Hadoop2。

Hadoop2的一个公共模块和三大核心组件组成了四个模块,简介如下:

(1)HadoopCommon:为其余Hadoop模块提供基础设备。

(2)HDFS:具备高可靠性、高吞吐量的分布式文件系统。

(3)MapReduce:基于Yarn系统,分布式离线并行计算框架。

(4)Yarn:负责作业调度与集群资源管理的框架。

Hadoop技术俨然成为大数据的关键点,也是大数据开发课程的重中之重。

假如你对大数据开发感兴趣,想系统学习大数据的话,可以加入大数据技术学习交流扣扣群458345782,私信管理员就可免费领取开发工具以及入门学习资料

说明
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » Hadoop技术优缺点详解

发表回复