| 价格 | ¥99.00 |
| 发货 | 广东东莞市 |
| 数量 | -+ |
| 库存 | 100本 |
准备好释放数据的强大潜能了吗?借助于这本《Hadoop指南》,你将学习如何使用Apache Hadoop构建和维护稳定性高、伸缩性强的分布式系统。本书是为程序员写的,可帮助他们分析任何大小的数据集。本书同时也是为管理员写的,帮助他们了解如何设置和运行Hadoop集群。
本书通过丰富的案例学习来解释Hadoop的幕后机理,阐述了Hadoop如何解决现实生活中的具体问题。第3版覆盖Hadoop的动态,包括新增的MapReduce API,以及MapReduce
2及其灵活性更强的执行模型(YARN)。
TOC \o "1-3" \h \z \u 第1章 初识Hadoop.. 1
1.1 数据!数据!... 1
1.2 数据的存储与分析... 3
1.3 相较于其他系统的优势... 4
1.3.1 关系型数据库管理系统... 5
1.3.2 网格计算... 7
1.3.3 志愿计算... 9
1.4 Hadoop发展简史... 10
1.5
Apache Hadoop和Hadoop生态系统.... 14
1.6 Hadoop的发行版本............................................................................................................. 15
1.6.1 本书包含的内容... 16
1.6.2 兼容性... 17
第2章 关于MapReduce.. 19
2.1 气象数据集... 19
2.2 使用Unix工具来分析数据... 21
2.3 使用Hadoop来分析数据... 23
2.3.1 map和reduce. 23
2.3.2 Java MapReduce. 24
2.4 横向扩展... 33
2.4.1 数据流... 34
2.4.2
combiner函数... 37
2.4.3 运行分布式的MapReduce作业... 39
2.5 Hadoop Streaming. 40
2.5.1
Ruby版本... 40
2.5.2
Python版本... 43
2.6 Hadoop Pipes. 44
第3章 Hadoop分布式文件系统.... 49
3.1 HDFS的设计... 49
3.2 HDFS的概念... 51
3.2.1 数据块... 51
3.2.2 namenode和datanode. 52
3.2.3 联邦HDFS. 53
3.2.4 HDFS的高可用性... 54
3.3 命令行接口... 56
3.4 Hadoop文件系统... 58
3.5 Java接口... 62
3.5.1 从Hadoop URL读取数据... 63
3.5.2 通过FileSystem API读取数据... 64
3.5.3 写入数据... 68
3.5.4 目录... 70
3.5.5 查询文件系统... 70
3.5.6 删除数据... 75
3.6 数据流... 75
3.6.1 剖析文件读取... 75
3.6.2 剖析文件写入... 78
3.6.3 一致模型... 81
3.7 通过Flume和Sqoop导入数据... 83
3.8 通过distcp并行复制... 84
3.9 Hadoop存档... 86
3.9.1 使用Hadoop存档工具... 86
3.9.2 不足... 88
第4章 Hadoop的I/O操作.... 89
4.1 数据完整性... 89
4.1.1 HDFS的数据完整性... 89
4.1.2 LocalFileSystem.. 91
4.1.3 ChecksumFileSystem.. 91
4.2 压缩... 92
4.2.1 codec. 93
4.2.2 压缩和输入分片... 98
4.2.3 在MapReduce中使用压缩... 99
4.3 序列化... 102
4.3.1 Writable接口... 103
4.3.2 Writable类... 105
4.3.3 实现定制的Writable集合... 114
4.3 序列化框架... 118
4.4 Avro. 121
4.4.1 Avro数据类型和模式... 122
4.4.2 内存中的序列化和反序列化... 126
4.4.3 Avro数据文件... 129
4.4.4 互操作性... 130
4.4.5 模式的解析... 133
4.4.6 排列顺序... 135
4.4.7 关于Avro
MapReduce. 137
4.4.8 使用Avro
MapReduce进行排序... 141
4.4.9 其他语言的Avro MapReduce. 143
4.5 基于文件的数据结构... 143
4.5.1 关于SequenceFile. 143
4.5.2 关于MapFile. 151
第5章 MapReduce应用开发