大数据时代的企业升级之道(套装共3册)pdf下载

大数据时代的企业升级之道(套装共3册)百度网盘pdf下载

作者:
简介:大数据时代的企业升级之道(套装共3册)
出版社:机械工业出版社
出版时间:2020-05-01
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

内容简介
  《用户画像:方法论与工程化解决方案》
  本书从技术维度系统讲解了用户画像的方法论和一些常见的工程化解决方案。全书共分为9个章节。第一章 用户画像基础:讲述用户画像的一些基础概念、数据仓库架构、整个项目开发的流程、以及画像相关的表结构设计;第二章 数据指标体系:从用户属性、用户行为、用户消费、风险控制等四个维度详细罗列了常用到的用户标签,这些标签基本涵盖了大部分场景一半以上的标签需求。同时介绍了标签的规范化命名方式;第三章 标签数据存储:讲了为什么使用Hive、MySQL、hbase等数据库对标签数据进行存储,以及存储实现方式;第四章 标签数据开发:本章是全书的重点章节,讲述了统计类标签、规则类标签、挖掘类标签、流式计算类标签的开发。以及用户特征库、人群计算、标签权重计算、打通数据服务层等方面的开发。;第五章 开发性能调优:主要包括数据倾斜调优、开发中间表、读取小文件处理、redis缓存热数据等数据性能优化方面;第六章 作业流程调度:数据的ETL调度是数据开发中的重要内容,本章主要讲了如何使用当下热门的开源调度工具Airflow进行数据的调度及场景调度异常的排查工作;第七章 用户画像产品化:开发画像后的标签数据,如果只是“躺在”数据仓库中,并不能发挥更大的业务价值。只有将画像数据产品化后才能更方便业务方的使用。本章主要讲述了产品端的用户画像是什么样子?如何帮助业务人员进行分析,提供服务的;第八章 用户画像应用:用户画像的应用包括用户分析、商品分析、流量分析、push、短信、邮件等营销以及站内的个性化推荐等应用场景;第九章 实践案例详解:前面的八个章节主要从工程化开发的角度讲了如何从0到1搭建起用户画像系统及其应用场景,本章从完整的工业实践应用角度,通过两个实践案例帮助读者更好地理解画像系统是如何切入到应用场景中帮助提升工作效率、提高ROI的。
  《敏捷思维:移动互联网和大数据时代IT企业转型、升级与再造之道》
  在移动互联网和大数据的时代浪潮中,各行各业都面临着生存难题和思维挑战。
  《敏捷思维:移动互联网和大数据时代IT企业转型、升级与再造之道》基于IBM敏捷转型成功实践,介绍IT企业产品和项目的全生命周期中管理、研发、测试的敏捷思维,实现“人、工具、流程”和谐统一的可靠转型。新敏捷DAD方法和ASM框架既适合大中型企业平行移植,也可通过敏捷扩展因子的调整为初创型企业提供升级之道。
  《敏捷思维:移动互联网和大数据时代IT企业转型、升级与再造之道》以IT界资深专家的视角诠释敏捷转型中的企业、团队和个人,利用心理学方法实现人格与职业的平衡,对于正处于转型、创新中的企业管理人员和技术研发人员都有很高的参考价值。
  《分布式数据库系统:大数据时代新型数据库技术》
  本书主要介绍分布式数据库系统和大数据库系统的基本理论与实现技术。全书共分12章,第1章和第2章介绍分布式数据库系统和大数据库系统的基础和背景,主要包括系统的基本概念、体系结构、发展历史、系统分类和主要研究问题;第3~9章为全书的重点,介绍分布式数据库系统和大数据库系统的核心技术,包括分布式数据库设计、分布式查询处理与优化、分布式查询的存取优化、分布式事务管理、分布式恢复管理、分布式并发控制、数据复制与一致性,并给出了Oracle应用示例;第10章和第11章介绍两个分布式的数据管理系统案例,分别为P2P数据管理系统和Web数据库集成系统;第12章介绍大数据库系统研究进展及发展趋势。
  本书内容新颖,理论与实践相结合,可作为计算机专业高年级本科生和研究生的教材,也可作为大数据管理和应用的研究和开发人员的参考书。
目录
总目录
用户画像:方法论与工程化解决方案
前言
第1章 用户画像基础
1.1 用户画像是什么
1.1.1 画像简介
1.1.2 标签类型
1.2 数据架构
1.3 主要覆盖模块
1.4 开发阶段流程
1.4.1 开发上线流程
1.4.2 各阶段关键产出
1.5 画像应用的落地
1.6 某用户画像案例
1.6.1 案例背景介绍
1.6.2 相关元数据
1.6.3 画像表结构设计
1.7 定性类画像
1.8 本章小结
第2章 数据指标体系
2.1 用户属性维度
2.1.1 常见用户属性
2.1.2 用户性别
2.2 用户行为维度
2.3 用户消费维度
2.4 风险控制维度
2.5 社交属性维度
2.6 其他常见标签划分方式
2.7 标签命名方式
2.8 本章小结
第3章 标签数据存储
3.1 Hive存储
3.1.1 Hive数据仓库
3.1.2 分区存储
3.1.3 标签汇聚
3.1.4 ID-MAP
3.2 MySQL存储
3.2.1 元数据管理
3.2.2 监控预警数据
3.2.3 结果集存储
3.3 HBase存储
3.3.1 HBase简介
3.3.2 应用场景
3.3.3 工程化案例
3.4 Elasticsearch存储
3.4.1 Elasticsearch简介
3.4.2 应用场景
3.4.3 工程化案例
3.5 本章小结
第4章 标签数据开发
4.1 统计类标签开发
4.1.1 近30日购买行为标签案例
4.1.2 最近来访标签案例
4.2 规则类标签开发
4.2.1 用户价值类标签案例
4.2.2 用户活跃度标签案例
4.3 挖掘类标签开发
4.3.1 案例背景
4.3.2 特征选取及开发
4.3.3 文本分词处理
4.3.4 数据结构处理
4.3.5 文本TF-IDF权重
4.3.6 朴素贝叶斯分类
4.4 流式计算标签开发
4.4.1 流式标签建模框架
4.4.2 Kafka简介
4.4.3 Spark Streaming集成Kafka
4.4.4 标签开发及工程化
4.5 用户特征库开发
4.5.1 特征库规划
4.5.2 数据开发
4.5.3 其他特征库规划
4.6 标签权重计算
4.6.1 TF-IDF词空间向量
4.6.2 时间衰减系数
4.6.3 标签权重配置
4.7 标签相似度计算
4.7.1 案例场景
4.7.2 数据开发
4.8 组合标签计算
4.8.1 应用场景
4.8.2 数据计算
4.9 数据服务层开发
4.9.1 推送至营销系统
4.9.2 接口调用服务
4.10 GraphX图计算用户
4.10.1 图计算理论及应用场景
4.10.2 数据开发案例
4.11 本章小结
第5章 开发性能调优
5.1 数据倾斜调优
5.2 合并小文件
5.3 缓存中间数据
5.4 开发中间表
5.5 本章小结
第6章 作业流程调度
6.1 crontab命令调度
6.2 Airflow工作平台
6.2.1 基础概念
6.2.2 Airflow服务构成
6.2.3 Airflow安装
6.2.4 主要模块功能
6.2.5 工作流调度
6.2.6 脚本实例
6.2.7 常用命令行
6.2.8 工程化调度方案
6.3 数据监控预警
6.3.1 标签监控预警
6.3.2 服务层预警
6.4 ETL异常排查
6.5 本章小结
第7章 用户画像产品化
7.1 即时查询
7.2 标签视图与标签查询
7.3 元数据管理
7.4 用户分群功能
7.5 人群分析功能
7.6 本章小结
第8章 用户画像应用
8.1 经营分析
8.1.1 商品分析
8.1.2 用户分析
8.1.3 渠道分析
8.1.4 漏斗分析
8.1.5 客服话术
8.1.6 人群特征分析
8.2 精准营销
8.2.1 短信/邮件营销
8.2.2 效果分析
8.3 个性化推荐与服务
8.4 本章小结
第9章 实践案例详解
9.1 风控反欺诈预警
9.1.1 应用背景
9.1.2 用户画像切入点
9.2 A/B人群效果测试
9.2.1 案例背景
9.2.2 用户画像切入点
9.2.3 效果分析
9.3 用户生命周期划分与营销
9.3.1 生命周期划分
9.3.2 不同阶段的用户触达策略
9.3.3 画像在生命周期中的应用
9.3.4 应用案例
9.4 高价值用户实时营销
9.4.1 项目应用背景
9.4.2 用户画像切入点
9.4.3 HBase应用场景小结
9.5 短信营销用户
9.5.1 案例背景
9.5.2 画像切入及其应用效果
9.6 Session行为分析应用
9.6.1 关于用户行为分析
9.6.2 案例背景
9.6.3 特征构建
9.6.4 分析方法与结论
9.7 人群效果监测报表搭建
9.7.1 案例背景
9.7.2 逻辑梳理
9.7.3 自动报表邮件
9.8 基于用户特征库筛选目标人群
9.8.1 案例背景
9.8.2 应用方式及效果
9.9 本章小结
附录 某产品用户画像项目规划文档
敏捷思维:移动互联网和大数据时代IT企业转型、升级与再造之道
序言一
序言二
序言三
序言四
序言五
前言
第1章 敏捷思潮
1.1 变革悄然而至
1.2 最简单的敏捷交付
1.3 百家争鸣
1.3.1 极限编程
1.3.2 水晶方法
1.3.3 动态系统开发方法
1.3.4 精益生产
1.4 Scrum
1.4.1 发源与发展
1.4.2 自我管理
1.4.3 七经八络
1.5 敏捷旅行
1.6 敏捷实施报告
1.7 案例分析:IBM的敏捷转型之路
1.7.1 转型历程
1.7.2 品牌的力量
1.7.3 核心竞争力
1.7.4 敏捷品牌
1.7.5 成功转型
第2章 敏捷落地艰难
2.1 敏捷实践误区
2.2 理论的局限性
2.3 传统团队践行
2.3.1 挑战传统管理
2.3.2 PMBOK理论
2.4 敏捷实施法则13条
第3章 大企业的敏捷转型
3.1 重新诠释敏捷宣言
3.2 新敏捷扩展模型
3.2.1 规范性敏捷交付方法
3.2.2 新敏捷思维的延展
3.2.3 案例分析:“唯衣定制”——ASM框架下的制衣品牌
3.3 持续改进转型模型
3.4 案例分析:IBM Rational中国的敏捷转型
3.4.1 统一的研发流程
3.4.2 流程开发的利器
3.4.3 研发转型的困境
3.4.4 定制企业开发过程
3.4.5 规范性敏捷管理
3.4.6 满足客户
3.4.7 培养客户关系
3.5 故事分享:Rational中国敏捷开发者的一天
第4章 初创企业的敏捷转型
4.1 初创企业的敏捷思维
4.1.1 使用瀑布式的初创企业必亡
4.1.2 开发新商业模式
4.1.3 以客户为中心的价值主张
4.1.4 抛弃以产品为中心
4.1.5 过硬的产品
4.2 以客户为中心
4.2.1 敏捷交付
4.2.2 建设敏捷团队
4.3 如何解决人事危机
4.3.1 快乐才是我的目标
4.3.2 人才流失
4.3.3 构建人文环境
4.4 人格与职业
4.4.1 荣格人格类型理论
4.4.2 16种人格类型及其特点
4.4.3 团队“人格”
4.4.4 择“优”录取
4.4.5 SJ型与SP型人格的任用
第5章 敏捷型人才的培养
5.1 如何培养自我管理的秉性
5.2 如何培养自知之明的秉性
5.3 如何培养自律的秉性
5.4 提供上升空间
5.5 团队的沟通
5.5.1 “听”的哲学
5.5.2 “说”的魔法
第6章 非凡的测试
6.1 故事分享:从测试工程师成长为敏捷测试工程师
6.2 决策影响力
6.3 合理投入
6.4 “等待”和“浪费”
6.4.1 仅仅足够好
6.4.2 理性规划
6.5 自动化敏捷测试
6.5.1 自动化的落足点
6.5.2 ROI指标判断
6.5.3 自动化测试的ROI
6.5.4 合理的投入
6.5.5 自动化回归测试
6.5.6 敏捷测试的自动化
6.5.7 与传统自动化的对比
6.5.8 自动化的ROI
6.5.9 小结
6.6 故事分享:Rational中国敏捷测试工程师的一天
6.7 选择自动化工具
6.7.1 度量尺度
6.7.2 量化指标
6.8 案例分析:改进自动化工具
附录A 有关敏捷思维、敏捷转型的常见问题和回答
附录B 第二代敏捷猜想
附录C 敏捷大赛评分规则
结束语
参考文献
分布式数据库系统:大数据时代新型数据库技术
前言
教学建议
第1章 分布式数据库系统概述
1.1 引言及准备知识
1.1.1 相关基本概念
1.1.2 相关基础知识
1.2 分布式数据库系统的基本概念
1.2.1 节点/场地
1.2.2 分布式数据库
1.2.3 分布式数据库管理系统
1.2.4 分布式数据库系统应用举例
1.2.5 分布式数据库的特性
1.3 分布式数据库系统的作用和特点
1.3.1 分布式数据库系统的作用
1.3.2 分布式数据库系统的特点
1.4 分布式数据库系统中的关键技术
1.4.1 关键技术
1.4.2 典型的分布式数据库原型系统简介
1.5 大数据应用与分布式数据库技术
1.5.1 大数据类型和应用
1.5.2 大数据特点
1.5.3 大数据处理过程
1.5.4 大数据管理新模式
1.5.5 分布式大数据库系统及关键技术
1.6 本章小结
习题
主要参考文献
第2章 分布式数据库系统的结构
2.1 DDBS的物理结构和逻辑结构
2.2 DDBS的体系结构
2.2.1 基于客户端/服务器结构的体系结构
2.2.2 基于中间件的客户端/服务器结构
2.3 DDBS的模式结构
2.4 DDBS的组件结构
2.4.1 应用处理器功能
2.4.2 数据处理器功能
2.5 多数据库集成系统
2.5.1 数据库集成
2.5.2 多数据库系统
2.6 对等型数据库系统
2.6.1 P2PDBS的数据集成体系结构
2.6.2 P2PDBS的体系结构
2.6.3 P2PDBS与DDBS的典型区别
2.7 DDBS的分类
2.7.1 非集中式数据库系统及P2PDBS的特性
2.7.2 DDBS的分类图
2.8 元数据的管理
2.8.1 数据字典的主要内容
2.8.2 数据字典的主要用途
2.8.3 数据字典的组织
2.9 Oracle系统体系结构
2.9.1 Oracle系统体系结构简介
2.9.2 Oracle中实现分布式功能的关键组件
2.9.3 Oracle分布式数据库架构
2.10 分布式大数据库系统
2.10.1 分布式大数据库系统的分类
2.10.2 分布式大数据库系统的体系结构
2.10.3 基于HDFS的分布式数据库
2.10.4 其他分布式数据库系统
2.11 本章小结
习题
主要参考文献
第3章 分布式数据库设计
3.1 设计策略
3.1.1 Top-Down设计过程
3.1.2 Bottom-Up设计过程
3.2 分片的定义及作用
3.2.1 分片的定义
3.2.2 分片的作用
3.2.3 分片设计过程
3.2.4 分片的原则
3.2.5 分片的种类
3.2.6 分布透明性
3.3 水平分片
3.3.1 水平分片的定义
3.3.2 水平分片的操作
3.3.3 水平分片的设计
3.3.4 水平分片的正确性判断
3.4 垂直分片
3.4.1 垂直分片的定义
3.4.2 垂直分片的操作
3.4.3 垂直分片的设计
3.4.4 垂直分片的正确性判断
3.5 混合分片
3.6 分片的表示方法
3.6.1 图形表示法
3.6.2 分片树表示法
3.7 分配设计
3.7.1 分配类型
3.7.2 分配设计原则
3.7.3 分配模型
3.8 数据复制技术
3.8.1 数据复制的优势
3.8.2 数据复制的分类
3.8.3 数据复制的常用方法
3.9 Oracle数据分布式设计案例
3.9.1 Oracle分布式数据库的水平分片
3.9.2 Oracle分布式数据库的垂直分片
3.9.3 Oracle集中式数据库的数据分区技术
3.10 大数据库的分布存储策略
3.10.1 分布式文件系统HDFS
3.10.2 基于SSTable的数据存储结构
3.10.3 大数据存储模型
3.10.4 数据分区策略
3.11 大数据库分布式存储案例
3.11.1 Bigtable
3.11.2 Cassandra
3.11.3 Spanner
3.12 本章小结
习题
主要参考文献
第4章 分布式查询处理与优化
4.1 查询处理基础
4.1.1 查询处理目标
4.1.2 查询优化的意义
4.1.3 查询优化的基本概念
4.1.4 查询优化的过程
4.2 查询处理器
4.2.1 查询处理器的特性
4.2.2 查询处理层次
4.3 查询分解
4.3.1 查询规范化
4.3.2 查询分析
4.3.3 查询约简
4.3.4 查询重写
4.4 数据局部化
4.5 片段查询的优化
4.6 Oracle分布式查询处理与优化案例
4.7 大数据库系统的查询API
4.7.1 基于类SQL的查询语言
4.7.2 基于编程接口的查询语言
4.8 大数据库的查询处理及优化
4.8.1 大数据库查询处理方法
4.8.2 基于MapReduce的查询处理
4.8.3 大数据库查询优化
4.9 本章小结
习题
主要参考文献
第5章 分布式查询的存取优化
5.1 分布式查询的基本概念
5.1.1 分布式查询的执行与处理
5.1.2 查询存取优化的内容
5.2 存取优化的理论基础
5.2.1 查询代价模型
5.2.2 数据库的特征参数
5.2.3 关系运算的特征参数
5.3 基于半连接的优化方法
5.3.1 半连接操作及相关规则
5.3.2 半连接运算的作用
5.3.3 使用半连接算法的通信代价估计
5.3.4 半连接算法优化原理
5.4 基于枚举法的优化技术
5.4.1 嵌套循环连接算法
5.4.2 基于排序的连接算法
5.4.3 散列连接算法
5.4.4 连接关系的传输方法
5.5 集中式系统中的查询优化算法
5.5.1 INGRES
5.5.2 System R方法
5.5.3 考虑代价的动态规划方法
5.5.4 PostgreSQL的遗传算法
5.6 分布式系统中的查询优化算法
5.6.1 Distributed INGRES方法
5.6.2 System R*方法
5.6.3 SDD-1方法
5.7 Oracle分布式查询优化案例
5.8 大数据库的索引查询优化方法
5.8.1 布隆过滤器
5.8.2 键值二级索引
5.8.3 跳跃表
5.9 大数据库的查询处理与优化
5.9.1 并行查询处理
5.9.2 基于分析引擎的大数据库查询优化
5.10 分布式缓存
5.10.1 分布式缓存概述
5.10.2 分布式缓存的体系结构
5.10.3 典型分布式缓存系统
5.10.4 分布式缓存与存储引擎的结合使用
5.11 本章小结
习题
主要参考文献
第6章 分布式事务管理
6.1 事务的基本概念
6.1.1 事务的定义
6.1.2 事务的基本性质
6.1.3 事务的种类
6.2 分布式事务
6.2.1 分布式事务的定义
6.2.2 分布式事务的实现模型
6.2.3 分布式事务管理的目标
6.3 分布式事务的提交协议
6.3.1 协调者和参与者
6.3.2 两段提交协议的基本思想
6.3.3 两段提交协议的基本流程
6.4 分布式事务管理的实现
6.4.1 LTM与DTM
6.4.2 分布式事务执行的控制模型
6.4.3 分布式事务管理的实现模型
6.5 两段提交协议的实现方法
6.5.1 集中式方法
6.5.2 分布式的2PC
6.5.3 分层式方法
6.5.4 线性方法
6.6 非阻塞分布式事务提交协议
6.6.1 三段提交协议的基本思想
6.6.2 三段提交协议的基本流程
6.7 Oracle分布式事务管理案例
6.8 大数据库的事务管理
6.8.1 大数据库的事务管理问题
6.8.2 大数据库系统设计的理论基础
6.8.3 弱事务型与强事务型大数据库
6.8.4 大数据库中的事务特性
6.8.5 大数据库的事务实现方法
6.9 本章小结
习题
主要参考文献
第7章 分布式恢复管理
7.1 分布式恢复概述
7.1.1 故障类型
7.1.2 恢复模型
7.2 集中式数据库的故障恢复
7.2.1 局部恢复系统的体系结构
7.2.2 数据更新策略
7.2.3 针对不同更新事务的恢复方法
7.3 分布式事务的故障恢复
7.3.1 两段提交协议对故障的恢复
7.3.2 三段提交协议对故障的恢复
7.4 分布式可靠性协议
7.4.1 可靠性和可用性
7.4.2 分布式可靠性协议的组成
7.4.3 两段提交协议的终结协议
7.4.4 两段提交协议的演变
7.4.5 三段提交协议的终结协议
7.4.6 三段提交协议的演变
7.5 Oracle分布式数据库系统故障恢复案例
7.6 大数据库的恢复管理
7.6.1 大数据库的恢复管理问题
7.6.2 大数据库系统中的故障类型
7.6.3 大数据库系统的故障检测技术
7.6.4 基于事务的大数据库容错技术
7.6.5 基于冗余的大数据库容错技术
7.7 本章小结
习题
主要参考文献
第8章 分布式并发控制
8.1 分布式并发控制的基本概念
8.1.1 并发控制问题
8.1.2 并发控制定义
8.2 并发控制理论基础
8.2.1 事务执行过程的形式化描述
8.2.2 集中式数据库的可串行化问题
8.2.3 分布式事务的可串行化问题
8.3 基于锁的并发控制方法
8.3.1 锁的类型和相容性
8.3.2 封锁规则
8.3.3 锁的粒度
8.4 两段封锁协议
8.4.1 基本的两段封锁协议
8.4.2 严格的两段封锁协议
8.4.3 可串行化证明
8.5 分布式数据库并发控制方法
8.5.1 基于锁的并发控制方法的实现
8.5.2 基于时间戳的并发控制算法
8.5.3 乐观的并发控制算法
8.6 分布式死锁管理
8.6.1 死锁等待图
8.6.2 死锁的检测
8.6.3 死锁的预防和避免
8.7 Oracle分布式数据库系统并发控制案例
8.7.1 Oracle中的锁机制
8.7.2 Oracle中的并发控制
8.8 大数据库并发控制技术
8.8.1 事务读写模式扩展
8.8.2 封锁机制扩展
8.8.3 基于多版本并发控制扩展
8.8.4 基于时间戳并发控制扩展
8.9 本章小结
习题
主要参考文献
第9章 数据复制与一致性
9.1 数据复制的作用
9.2 数据复制一致性模型
9.3 分布式数据库复制策略
9.3.1 数据复制的执行方式
9.3.2 数据复制的实现方法
9.3.3 数据复制的体系结构
9.4 数据复制协议
9.4.1 主从复制协议
9.4.2 对等复制协议
9.5 大数据库一致性协议
9.5.1 Paxos协议
9.5.2 反熵协议
9.5.3 NWR协议
9.5.4 向量时钟技术
9.6 大数据库复制一致性管理
9.6.1 基于Paxos的复制管理技术
9.6.2 基于反熵的复制管理技术
9.6.3 基于NWR的复制管理技术
9.6.4 基于向量时钟的复制管理技术
9.7 本章小结
习题
主要参考文献
第10章 P2P数据管理系统
10.1 P2P系统概述
10.2 P2P系统的体系结构
10.2.1 集中式P2P网络
10.2.2 全分布式P2P网络
10.2.3 混合型P2P网络
10.3 P2P系统中的数据管理
10.4 资源的定位和路由
10.4.1 面向非结构化P2P网络的资源定位方法
10.4.2 面向结构化P2P网络的资源定位方法
10.5 处理语义异构性
10.6 查询处理与优化
10.6.1 查询处理
10.6.2 查询优化
10.7 本章小结
习题
主要参考文献
第11章 Web数据库集成系统
11.1 Web数据库集成系统概述
11.2 三种体系结构介绍
11.2.1 数据供应模式
11.2.2 数据收集模式
11.2.3 元搜索模式
11.3 基于元搜索模式的Web数据库集成系统WDBIntegrator
11.3.1 系统总体结构
11.3.2 Web数据库资源搜索子系统
11.3.3 资源查询子系统
11.4 本章小结
习题
主要参考文献
第12章 大数据库系统研究进展
12.1 数据模型的研究
12.1.1 支持大数据库管理的数据模型研究
12.1.2 读写方式
12.1.3 支持大数据库管理的分布式索引技术
12.1.4 支持的查询
12.2 基于MapReduce框架的查询处理与优化技术研究
12.2.1 基于MapReduce的支持大数据处理的优化框架研究
12.2.2 基于MapReduce的支持大数据计算的优化策略研究
12.2.3 基于MapReduce的支持多数据集的连接查询研究
12.2.4 MapReduce与NoSQL数据库相结合的研究
12.3 支持事务的研究
12.3.1 应用层保证事务一致性
12.3.2 本地事务支持
12.3.3 有限范围内的事务支持
12.3.4 弹性的事务支持
12.3.5 面向分区数据支持分布式事务的研究
12.3.6 异构多存储的可扩展的事务
12.4 动态负载均衡技术的研究
12.4.1 面向多租户的动态迁移技术
12.4.2 面向查询处理的负载均衡技术
12.4.3 基于中间件的面向负载的动态均衡技术
12.5 副本管理研究
12.5.1 自适应副本策略研究
12.5.2 数据一致性维护策略研究
12.5.3 多数据中心的副本一致性维护策略研究
12.6 支持多存储模式的数据库系统
12.6.1 支持访问多数据模式的大数据库系统
12.6.2 自适应的多数据模式的大数据库系统
12.6.3 支持分析型数据的分布式数据库系统
12.7 其他研究
12.8 总结及研究展望
12.8.1 关键技术问题
12.8.2 研究挑战
习题
主要参考文献