更新时间:2020-10-13 11:30:18
封面
版权页
内容提要
编委会
丛书序一
丛书序二
前言
第1章 绪论
1.1 数据库的相关概念
1.1.1 关系型数据库管理系统
1.1.2 关系型数据库的瓶颈
1.1.3 NoSQL的特点
1.1.4 NewSQL的概念
1.1.5 NoSQL的典型应用场景
1.2 大数据的技术体系
1.2.1 大数据的特征
1.2.2 大数据的采集
1.2.3 大数据的存储
1.2.4 大数据的管理和使用
1.2.5 数据可视化
1.2.6 大数据安全与治理
小结
思考题
第2章 NoSQL数据库的基本原理
2.1 关系型数据库的原理简述
2.1.1 关系模型
2.1.2 关系型数据库的完整性约束
2.1.3 关系型数据库的事务机制
2.1.4 关系型数据库的分布式部署
2.2 分布式数据管理的特点
2.2.1 数据分片
2.2.2 数据多副本
2.2.3 一次写入多次读取
2.2.4 分布式系统的可伸缩性
2.3 分布式系统的一致性问题
2.3.1 CAP原理
2.3.2 BASE和最终一致性
2.3.3 Paxos算法简介
2.4 NoSQL的常见模式
2.4.1 键值对存储模式
2.4.2 文档式存储模式
2.4.3 列存储模式
2.4.4 图存储模式
2.5 NoSQL系统的其他相关技术
2.5.1 分布式数据处理
2.5.2 时间同步服务
2.5.3 布隆过滤器
第3章 HDFS的基本原理
3.1 Hadoop概述
3.1.1 Hadoop的由来
3.1.2 Hadoop的架构与扩展
3.1.3 Hadoop的部署需求
3.2 HDFS原理
3.2.1 HDFS架构
3.2.2 Namenode的数据结构
3.2.3 数据分块和多副本机制
3.2.4 数据读写原理
3.2.5 HDFS支持的序列化文件
3.3 部署和配置HDFS
3.3.1 部署HDFS
3.3.2 HDFS的基本配置
3.3.3 集群的启动和停止
3.4 使用和管理HDFS
3.4.1 管理和操作命令
3.4.2 格式化Namenode
3.4.3 Namenode的安全模式
3.4.4 元数据恢复
3.4.5 子节点添加与删除
3.4.6 HDFS文件系统操作
3.4.7 以Web方式查看文件系统
3.5 MapReduce原理简介
3.6 Hive分布式数据仓库
第4章 HBase的基本原理与使用
4.1 HBase概述
4.2 HBase的数据模型
4.3 HBase的拓扑结构
4.4 HBase部署与配置
4.5 子节点伸缩性管理
4.6 HBase的基本操作
4.6.1 HBase Shell
4.6.2 表和列族操作
4.6.3 数据更新
4.6.4 数据查询
4.6.5 过滤查询
4.6.6 快照操作
4.7 批量导入导出
4.7.1 批量导入数据
4.7.2 备份和恢复
4.8 通过Java访问HBase
4.8.1 开发环境的配置
4.8.2 表的连接和操作
4.8.3 数据更新
4.8.4 数据查询
4.8.5 删除列和行
4.8.6 过滤器的使用
4.9 通过Python访问HBase