揭示了Apache Hadoop如何为你释放数据的力量。这本内容的书籍展示了如何使用Hadoop架构搭建和维护、可伸缩的分布式系统。Hadoop架构是MapReduce算法的一种开源应用,是Google开创其帝国的重要基石。程序员可从中探索如何分析海量数据集,管理员可以了解如何建立与运行Hadoop集群。 《Hadoop指南(影印版第2版修订版)》涵盖了Hadoop最近的更新,包括诸如Hive、Sqoop和Avro之类的新特性。它也提供了案例学习来展示Hadoop如何解决特殊问题。期待尽情享受你的数据?这就是你要的书。本身由Tom White著。
Tom White从2007年起就是Apache Hadoop的理事。他是Apache软件基金会的成员和Cloudera的工程师。Tom为oreilly.com,java.net~llBM的developerWorks撰文,并为业内会议演讲。
Foreword Preface 1. Meet Hadoop Data! Data Storage and Analysis Comparison with Other Systems RDBMS Grid Computing Volunteer Computing A Brief History of Hadoop Apache Hadoop and the Hadoop Ecosystem 2. MapReduce A Weather Dataset Data Format Analyzing the Data with Unix Tools Analyzing the Data with Hadoop Map and Reduce Java MapReduce Scaling Out Data Flow Combiner Functions Running a Distributed MapReduce Job Hadoop Streaming Ruby Python Hadoop Pipes Compiling and Running 3. The Hadoop Distributed Filesystem The Design of HDFS HDFS Concepts Blocks Namenodes and Datanodes The Command-Line Interface Basic Filesystem Operations Hadoop Filesystems Interfaces The Java Interface Reading Data from a Hadoop URL Reading Data Using the FileSystem API Writing Data Directories Querying the Filesystem Deleting Data Data Flow. Anatomy of a File Read Anatomy of a File Write Coherency Model Parallel Copying with distcp Keeping an HDFS Cluster Balanced Hadoop Archives Using Hadoop Archives Limitations 4. Hadoop I/0 Data Integrity Data Integrity in HDFS LocalFileSystem ChecksumFileSystem Compression Codecs Compression and Input Splits Using Compression in MapReduce Serialization The Writable Interface Writable Classes Implementing a Custom Writable Serialization Frameworks Avro File-Based Data Structures SequenceFile ……
印刷质量和那好,纸张也很厚实,内容还没看
大家作品 非常经典 内容详实 没得说!!!
非常棒
了解hadoop的权威书籍
很好
HADOOP权威指南果然不错
送快递的人很有礼貌~
分析详尽
正在看
可以提高专业英语阅读水平
基础教育可以深度稍微
不错。
该领域的经典的书籍。
据说这本书不错,我们教研室买了两本。中文版啊和英文版都买了。
原版书还是比翻译本强很多,建议当当多出一些原版的,不会产生翻译歧义,尤其是技术类的书籍。
正如其名字所言,绝对是权威,学习hadoop必看。有个缺点就是由于hadoop更新太快,好书也容易过时。