详细介绍
Apache Hadoop 是一个开源框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。该项目包括这些模块:Hadoop Common、Hadoop Distributed File System (HDFS)、Hadoop YARN 和 Hadoop MapReduce。
功能特性
- HDFS(分布式文件系统)
- MapReduce(分布式计算框架)
- YARN(资源管理器)
相关公司
ClouderaHortonworksMapR
基本信息
分类:数据存储
当前版本:3.3.6
许可证:Apache-2.0
替代方案
- Spark
- Flink