Hadoop简介 - windcoder

Apache Hadoop是一款用于可靠，可扩展的分布式计算的开源软件。

Apache Hadoop软件库是一个允许使用简单的编程模型跨计算机集群分布式处理大型数据集的框架。它旨在从单个服务器扩展到数千台计算机，每台计算机都提供本地计算和存储。

Hadoop本身不是依靠硬件来提供高可用性，而是设计用于检测和处理应用程序层的故障，从而在计算机集群之上提供高可用性服务，每个计算机都可能容易出现故障。

Hadoop框架包括以下四个模块：

最近在官方首页出现了一个新的模块Hadoop Ozone，其功能是提供Hadoop的对象存储。目前处于alpha版本，docs文档中暂未提及。

高可靠性：Hadoop 按位存储和处理数据的能力值得人们信赖。
高可扩展性： Hadoop 是在可用的计算机集簇间分配数据并完成计算任务的，这些集簇可以方便地扩展到数以干计的节点中。
高效性： Hadoop能够在节点之间动态地移动数据，并保证各个节点的动态平衡，因此处理速度非常快。
高容错性： Hadoop能够自动保存数据的多个副本，并且能够自动将失败的任务重新分。
低成本：与一体机、商用数据仓库以及 QlikView、 Yonghong Z- Suites 等数据集市相比，Hadoop 是开源的，项目的软件成本因此会大大降低。

预览

除特别注明外，本站所有文章均为 windcoder 原创，转载请注明出处来自： hadoopjianjie
License CC BY-SA 4.0 以商业目的使用本网站原创内容需获许可，非商业目的使用授权遵循CC BY-NC 4.0

Loading comments...

0 条评论

暂无数据

预览