DW2.0:下一代数据仓库的构架数据仓库商业智能计算机教材pdf下载pdf下载

DW2.0:下一代数据仓库的构架数据仓库商业智能计算机教材百度网盘pdf下载

作者:
简介:本篇主要提供DW2.0:下一代数据仓库的构架数据仓库商业智能计算机教材pdf下载
出版社:互动创新图书专营店
出版时间:2010-03
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

 书名:  DW2.0:下一代数据仓库的构架[图书]|196487
 图书定价: 45元
 图书作者: (美)William H. Inmon;Derek Strauss;Genia Neushloss
 出版社:  机械工业出版社
 出版日期:  2010/3/1 0:00:00
 ISBN号: 9787111288268
 开本: 16开
 页数: 218
 版次: 1-1
 作者简介
W.H.Inmon:数据仓库之父。他已编写了49本著作,并被译成9种语言。Bill创建了世界上*个ETL软件公司。他在大多数主要的行业期刊上发表了1000多篇论文。除南极洲之外,Bill在各大洲都组织过研讨会并在各种会议上发言。他拥有九项软件专利。他*新成立的一个公司是Forest Rim Technology公司,该公司致力于非结构化数据的存取并将其整合到结构化环境中。每月有超过1 000 000人访问Bill的网站:inmoncif.com。他在beyenetwork.com上的每周通讯已经在业界被广泛阅读,每周有75 000个订阅者。Derek Strauss:Gavroshe公司的创始人、CEO和首席顾问。他拥有28年IT界从业经验和22年信息资源管理及商业智能/数据仓库领域的从业经验。Derek发起并管理了许多企业项目,他倡导运用商业智能、数据仓库来改善数据质量。Bill Inmon的CIF(Corporate Information Factory)理论及John Zachman的EAF(Enterprise Architecture Framework)理论是Derek的工作的基石。Derek同时也是一名专家研讨会主持人,他曾多次在国内及国际的数据仓库会议中演讲。另外,他还是DW2.0认证的构架师和培训师。Genia Neushloss:Gavroshe公司的联合创始人和首席顾问。30多年来,她在保险业、金融业、制造业、采矿业及电信业都拥有相当深厚的管理及技术经验。Genia曾举办JAD/JRP和系统再造培训课程,是系统再造方法集的编码开发者之一。她拥有22年规划、分析、设计和构建数据仓库的专业经验。Genia多次在欧洲、美国和非洲等与观众见面。另外,她也是DW2.0认证的构架师和培训师。
 内容简介
本书是数据仓库和商业智能领域的又一部经典著作,讲述了整个生命周期各个环节的具体工作,从业务需求的视角,引导读者全面认识下一代数据仓库系统的构架。本书包含了DW20详细的定义和描述,此外,书中对数据仓库的结构、内容及其前景进行了介绍。
本书主要面向数据仓库的业务分析人员、信息构架师、系统开发人员、项目经理、数据仓库技术人员、数据库管理员、数据建模人员、数据管理员等。
 目录

出版者的话
译者序
前言
关于作者
第1章数据仓库简史及*代数据仓库
1.1数据库管理系统
1.2在线应用
1.3个人电脑和4GL技术
1.4蜘蛛网环境
1.5企业角度的演化
1.6数据仓库环境
1.7什么是数据仓库
1.8整合数据——一个痛苦的经历
1.9数据的量
1.10一种不同的开发方法
1.11演变到DW2.0环境
1.12数据仓库的商业影响
1.13数据仓库环境的各种组件
1.13.1ETL——抽取/转换/装载
1.13.2ODS——操作数据存储
1.13.3数据集市
1.13.4探索仓库
1.14数据仓库的演变——从企业的角度
1.15关于数据仓库的其他观念
1.16主动数据仓库
1.17联合数据仓库方法
1.18星状模式方法
1.19数据集市数据仓库
1.20建立一个“真正的”数据仓库
1.21总结
第2章DW2.0简介
2.1DW2.0——一种新的范式
2.2DW2.0——从企业的角度
2.3数据的生命周期
2.4设置不同区的原因
2.5元数据
2.6数据访问
2.7结构化数据/非结构化数据
2.8文本分析
2.9“废话”
2.10术语问题
2.11特定文本/一般文本
2.12元数据——一个主要组成部分
2.13本地元数据
2.14基础技术
2.15不断变化的业务需求
2.16DW2.0中的数据流
2.17数据量
2.18实用应用程序
2.19DW2.0和参照完整性
2.20DW2.0的报告
2.21总结
第3章DW2.0组成部分——关于不同区
3.1交互区
3.2整合区
3.3近线区
3.4归档区
3.5非结构化处理
3.6企业用户的观点
3.7总结
第4章DW2.0中的元数据
4.1数据和分析的可复用性
4.2DW2.0中的元数据
4.3主动知识库/被动知识库
4.4主动知识库
4.5企业元数据
4.6元数据和记录系统
4.7分类
4.8内部分类/外部分类
4.9归档区元数据
4.10维护元数据
4.11举例说明如何使用元数据
4.12终端用户的观点
4.13总结
第5章DW2.0技术基础设施的流动性
5.1技术基础设施
5.2快速的业务改变
5.3环状改变
5.4打破循环
5.5缩短IT响应时间
5.6语义暂态、语义常态数据
5.7语义暂态数据
5.8语义稳定的数据
5.9混合语义稳定和不稳定数据
5.10分离语义稳定和不稳定数据
5.11减缓业务的改变
5.12创建数据快照
5.13历史记录
5.14数据划分
5.15终端用户的观点
5.16总结
第6章DW2.0的方法与途径
6.1螺旋式方法——主要特点综述
6.2七流法——总览
6.3企业参考模型流
6.4企业知识协调流
6.5信息工厂开发流
6.6数据归档定位流
6.7数据纠正流(旧称数据清理流)
6.8基础设施流
6.9整体信息质量管理流
6.10总结
第7章统计处理和DW2.0
7.1两种类型的处理
7.2使用统计分析
7.3比较的完整性
7.4启发式分析
7.5冻结的数据
7.6探索型处理
7.7分析频率
7.8探索工具
7.9探索型处理数据的来源
7.10更新探索数据
7.11基于项目的数据
7.12数据集市和探索工具
7.13数据回流
7.14在内部使用探索数据
7.15企业分析员的观点
7.16总结
第8章数据模型与DW2.0
8.1智能路线图
8.2数据模型和企业
8.3整合范围
8.4区别粒状型数据和概括型数据
8.5数据模型的层次
8.6数据模型和交互区
8.7企业数据模型
8.8模型转化
8.9数据模型和非结构化数据
8.10企业用户的观点
8.11总结
第9章监视DW2.0环境
9.1监视DW2.0环境
9.2事务监视
9.3数据质量监视
9.4数据仓库监视
9.5事务监视——响应时间
9.6高峰期处理
9.7ETL数据质量监视
9.8数据仓库监视工具
9.9休眠数据
9.10企业用户的观点
9.11总结
第10章DW2.0与安全
10.1保护访问数据
10.2加密技术
10.3缺点
10.4防火墙
10.5使数据脱机
10.6限制性加密
10.7直接转储
10.8数据仓库监视
10.9检测攻击
10.10近线区数据的安全
10.11企业用户的观点
10.12总结
第11章时间相关数据
11.1DW2.0中的所有数据——与时间相关
11.2交互区中的时间相关性
11.3DW2.0其他部分中的数据相关
11.4整合区中的事务处理
11.5离散数据
11.6连续时间段数据
11.7一个记录序列
11.8非重叠记录集
11.9开始和结束一个记录序列
11.10数据的连续性
11.11时间瓦解数据
11.12归档区中的时间相关变量
11.13企业用户的观点
11.14总结
第12章DW2.0的数据流
12.1贯穿整个构架的数据流
12.2进入交互区
12.3ETL的角色
12.4进入整合区的数据流
12.5进入近线区的数据流
12.6进入归档区的数据流
12.7下降的数据访问概率
12.8数据的异常流
12.9企业用户的观点
12.10总结
第13章ETL处理与DW2.0
13.1转换数据状态
13.2ETL适用范围
13.3应用数据到企业数据的转换
13.4ETL工作模式
13.5源和目标
13.6ETL映射
13.7状态转换——实例
13.8更加复杂的转换
13.9ETL与吞吐量
13.10ETL与元数据
13.11ETL与审核记录
13.12ETL与数据质量
13.13创建ETL
13.14代码创建或参数驱动的ETL
13.15ETL与丢弃
13.16变化数据的捕获
13.17ELT
13.18企业用户的观点
13.19总结
第14章DW2.0与粒度管理器
14.1粒度管理器
14.2提高粒度级别
14.3过滤数据
14.4粒度管理器的功能
14.5本地与第三方粒度管理器的比较
14.6粒度管理器的并行化
14.7作为副产品的元数据
14.8企业用户眼中的粒度管理器
14.9总结
第15章DW2.0和性能
15.1好的性能——DW2.0的基石
15.2在线响应时间
15.3分析响应时间
15.4数据的流动
15.5队列
15.6启发式处理
15.7分析的生产率和响应时间
15.8索引
15.9移除休眠数据
15.10终端用户培训
15.11监控环境
15.12容量规划
15.13元数据
15.14批处理的并行
15.15事务处理的并行
15.16工作负荷量的管理
15.17数据集市
15.18探索工具
15.19将事务分为不同的类
15.20服务标准协议
15.21保护交互区
15.22数据分割
15.23选择合适的硬件
15.24区分“农民”和“探索者”
15.25数据的物理分组
15.26检查自动产生的代码
15.27企业用户的观点
15.28总结
第16章迁移
16.1房屋和城市
16.2在一个完美情况中迁移
16.3完美情况几乎永远不会发生
16.4增量式添加组件
16.5添加归档区
16.6建立企业元数据
16.7建立元数据基础结构
16.8“吞没”源系统
16.9作为缓冲器的ETL
16.10迁移到非结构化的环境
16.11企业用户的观点
16.12总结
第17章成本验证和DW2.0
17.1DW2.0的成本值吗
17.2宏观层次的价值验证
17.3微观层次的价值验证
17.4公司B拥有DW2.0
17.5生**的分析
17.6按步骤执行
17.7总成本是多少
17.8考虑公司B
17.9考虑DW2.0的成本
17.10信息的现实情况
17.11DW2.0真正的经济效益
17.12信息的时间价值
17.13整合的价值
17.14历史信息
17.15*代DW和DW2.0——在经济效益上的比较
17.16企业用户的观点
17.17总结
第18章DW2.0中的数据质量
18.1DW2.0中的数据质量工具集
18.2数据分析工具和逆向工程数据模型
18.3数据模型种类
18.4数据分析不一致对自上而下建模的挑战
18.5总结
第19章DW2.0和非结构化数据
19.1DW2.0和非结构化数据
19.2文本读取
19.3在哪里进行文本分析处理
19.4文本整合
19.5简单编辑
19.6无用词
19.7同义词替换
19.8同义词串联
19.9同形异义解析
19.10建立主题
19.11外部术语表/分类法
19.12分词
19.13替换拼写
19.14跨语言的文本
19.15直接搜索
19.16间接搜索
19.17术语
19.18半结构化数据/值=名称数据
19.19准备数据所需的技术
19.20关系数据库
19.21结构化/非结构化连接
19.22企业用户的观点
19.23总结
第20章DW2.0与记录系统
20.1其他记录系统
20.2企业用户的观点
20.3总结
第21章多方面的话题
21.1数据集市
21.2数据集市带来的便利
21.3转换数据集市数据
21.4监视DW2.0
21.5在数据集市间移动数据
21.6不合格数据
21.7用以平衡的条目
21.8重新设置值
21.9数据修正
21.10数据移动的速度
21.11数据仓库工具
21.12总结
第22章DW2.0环境中的处理
第23章管理DW2.0环境
23.1数据模型
23.2构架管理
23.2.1确定什么时候需要归档区
23.2.2确定是否需要近线区
23.3元数据管理
23.4数据库管理
23.5数据管理
23.6系统和技术管理
23.7DW2.0环境管理人员的管理
23.7.1优化及优先冲突
23.7.2预算
23.7.3进度表和里程碑的确定
23.7.4资源分配
23.7.5管理咨询人员
23.8总结