与Hadoop共舞——Hadoop用于Rackspace的日志处理

(整期优先)网络出版时间:2010-05-15
/ 1
Hadoop是ApacheLucene创始人DougCutting开发的使用广泛的文本搜索库。它起源于ApacheNutch,后者是一个开源的网络搜索引擎,本身也是Lucene项目的一部分。ApacheHadoop架构是MapReduce算法的一种开源应用,是Google开创其帝国的重要基石。