Hadoop是新一代并行分布处理“大数据”的架构和技术.本文主要讨论了Hadoop的分布式系统架构方式,并重点描述了分布式文件系统HDFS、分布式并行计算MapReduce及其生态系统等实现原理和运行机制.
四川工商学院学术新视野
2017年4期