Apache Hadoop

Apache Hadoop

开源分布式大数据存储与计算框架

分布式存储MapReduce大数据框架

详细介绍

Apache Hadoop 是一个开源框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。该项目包括这些模块:Hadoop Common、Hadoop Distributed File System (HDFS)、Hadoop YARN 和 Hadoop MapReduce。

功能特性

  • HDFS(分布式文件系统)
  • MapReduce(分布式计算框架)
  • YARN(资源管理器)

相关公司

ClouderaHortonworksMapR

基本信息

分类:数据存储
当前版本:3.3.6
许可证:Apache-2.0

替代方案

  • Spark
  • Flink