Hadoop

Hadoop YARN简介 Java笔记

Hadoop YARN简介

YARN 的基本思想是将资源管理和作业调度/监控的功能分解为单独的守护进程。 ResourceManager(RM):全局资源管理器,负责整个系统的资源管理和分配。它主要由两个组件构成:调度器(Sch···
Hadoop MapReduce简介 Java笔记

Hadoop MapReduce简介

概述 MapReduce作业(job)通常将输入数据集拆分为独立的块,这些块由map任务(map tasks)以完全并行的方式处理。框架对maps的输出(outputs)排序,然后输入到reduce ···
Hadoop HDFS简介 Java笔记

Hadoop HDFS简介

HDFS是一种设计用于在通用硬件(commodity hardware)上运行的分布式文件系统。最初是作为Apache Nutch网络搜索引擎项目的基础设施而构建的。 HDFS具有高度容错能力,旨在部···
Hadoop简介 Java笔记

Hadoop简介

Apache Hadoop是一款用于可靠,可扩展的分布式计算的开源软件。 Apache Hadoop软件库是一个允许使用简单的编程模型跨计算机集群分布式处理大型数据集的框架。它旨在从单个服务器扩展到数···
Logstash6整合Hadoop Java笔记

Logstash6整合Hadoop

前提 本文是之前elk的后续,故默认已搭建好logstash等elk相关环境。侧重点是Hadoop安装以及其与logstash的Output插件的整合。ELK的搭建可见:ELK实时日志管理-系统搭建 ···