Hadoop是一个开源的完整的分布式计算平台,用于应对PB级甚至ZB级海量数据的存储。Hadoop以开源的方式提供了PaaS服务所需要的大部分分布式技术,具有高可靠性、高扩展性、高效性、高容错性等优点。因此用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。Hadoop Common 、 MapReduce 、 HBase 、 HDFS和ZooKeeper是最核心的部分,负责分布式数据存储、分布式计算模型和并发访问控制,共同组成完整的分布式系统。MapReduce是Hadoop的编程模型,是一 ......