这是一本技术深度与企业实践并重的著作,由百度的Hadoop技术工程师撰写,是百度Hadoop技术实践经验的总结。本书使用、实现原理、运维和开发4个方面对Hadoop的核心技术进行了深入的讲解:(1)使用:详细讲解了HDFS存储系统、MapReduce计算框架,以及HDFS的命令系统;(2)原理:结合源代码,深度分析了MapReduce、HDFS、Streaming、Pipes、Hadoop作业调度系统等重要技术和组件的架构设计、工作机制和实现原理;(3)运维:结合百度的实际生产环境,详细讲解了Hadoop集群的安装、配置、测试以及管理和运维;(4)开发:详细讲解了HadoopStreaming、Pipes的使用和开发实践,以及MapReduce的编程实践和常见问题。与市面上已有的Hadoop相比,本书的不同之处是它直切企业应用和实践Hadoop技术的痛点,深入讲解了企业最需要和最头疼的技术和问题,内容上非常聚焦。
百度博学Hadoop技术专家和高级算法工程师撰写,结合百度大数据实践,直击企业痛点,多位大数据技术专家联袂推荐!
从使用、原理、运维和开发4个方面深度讲解Hadoop最核心的技术
翟周伟,就职于百度,博学Hadoop技术专家,专注于Hadoop&大数据、数据挖掘、自然语言处理等领域。2009年便开始利用Hadoop构建商业级大数据系统,是国内该领域最早的一批人之一,负责设计过多个基于Hadoop的大数据平台和分析系统。2011年合著出版《Hadoop开源云计算平台》。在自然语言处理领域申请过一项发明专利。
本站合法持有《出版物经营许可证》,仅销售经国家新闻出版署批准的合法期刊,不是任何杂志、图书官网,不涉及出版事务。本站仅提供有限咨询服务,需要用户自己向出版商投稿且没有绿色通道,是否录用一切以出版商通知为准。提及的第三方名称或商标,其知识产权均属于相应的出版商或期刊,本站与上述机构无从属关系,所有引用均出于解释服务内容的考量,符合商标法规范。本页信息均由法务团队进行把关,若期刊信息有任何问题,请联系在线客服,我们会认真核实处理。若用户需要出版服务,请联系相关出版商。
特别声明:本站持有《出版物经营许可证》,主要从事期刊杂志零售,不是任何杂志官网,不涉及出版事务,特此申明。
工信部备案:蜀ICP备09010985号-11 川公网安备:51092202000082 统一信用码:91510922MACX24HU41
出版物经营许可证:射行审新出发2023字第016号 股权代码:102064© 版权所有:四川博文网络科技有限责任公司太和分公司