详细介绍Apache Hadoop 是一个开源框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。该项目包括这些模块:Hadoop Common、Hadoop Distributed File System (HDFS)、Hadoop YARN 和 Hadoop MapReduce。功能特性HDFS(分布式文件系统)MapReduce(分布式计算框架)YARN(资源管理器)相关公司ClouderaHortonworksMapR