pdf下载网
计算机
历史
经济
管理
心理
社会
传记
哲学
医学
经典
大数据特征降维百度网盘pdf下载
作者:
简介:大数据特征降维
出版社:中国水利水电出版社
出版时间:2019-04-01
pdf下载价格:0.00¥
免费下载
前去下载
书籍下载
下载地址
内容介绍
编辑推荐
大专及以上
查看全部↓
内容简介
本书从高维大数据的特征降维出发,指出大数据时代粗糙集特征选择面临的挑战,介绍了群智能算法的独特优势和存在的问题,对粗糙集和群智能的理论与经典算法进行了总结归纳并提出一种基于群智能和粗糙集的特征选择框架,依据此框架设计相关特征选择算法,应用于银行个人信用评分系统与高维数据集进行特征降维。本书可供从事机器学习和大数据挖掘的高校教师、研究生、科研院所的科研人员及有关工程技术人员使用。
查看全部↓
作者简介
胡玉荣,女,1970年7月生,湖北钟祥人,汉族,中共党员,现为荆楚理工学院教授,研究生处副处长,荆门市第三届市级“把关人才”,湖北省第十三届人民代表大会代表。武汉大学计算机软件与理论专业博士毕业,长期从事数据挖掘和智能计算领域的研究工作,主持和参与省市各级科研项目10余项,编写教材4部,指导学生毕业论文获湖北省优秀学士学位论文。发表论文20余篇,其中10篇论文被SCI/EI检索,2篇论文获湖北省优秀学术论文二等奖和荆门市优秀学术论文一等奖。申请发明专利1项,软件著作权登记4项,荣获湖北省高等学校教学成果奖三等奖2项。
查看全部↓
目录
前言
第1章 绪论
1.1 本书研究背景
1.2 特征选择概述
1.3 国内外研究现状
1.4 本书研究内容
1.5 本书的组织结构
第2章 粗糙集与群智能
2.1 引言
2.2 粗糙集
2.3 群智能
2.4 基于群智能和粗糙集的特征选择框架
2.5 本章小结
第3章 基于蚁群优化和粗糙集的特征选择方法
3.1 引言
3.2 基于蚁群优化和粗糙集的特征选择算法HSACO
3.3 对比实验及结果分析
3.4 本章小结
第4章 基于粒子群优化和粗糙集的特征选择方法
4.1 引言
4.2 基于粒子群优化和粗糙集的特征选择算法DPPSO
4.3 对比实验及结果分析
4.4 本章小结
第5章 基于人工蜂群和粗糙集的特征选择方法
5.1 引言
5.2 基于人工蜂群和粗糙集的特征选择算法NDABC
5.3 对比试验及结果分析
5.4 本章小结
第6章 银行个人信用评分中的特征选择
6.1 银行个人信用评分
6.2 实验数据
6.3 基于群智能和粗糙集的特征选择在信用评分中的应用
6.4 本章小结
第7章 面向大数据的高维数据特征选择
7.1 高维数据特征选择
7.2 实验数据
7.3 基于群智能和粗糙集的特征选择在高维数据中的应用
7.4 本章小结
第8章 总结与展望
8.1 总结
8.2 展望
参考文献
查看全部↓
前言
前言
伴随着科技新浪潮,计算机和互联网技术日益普及,大数据时代已悄然来临。大数据正在成为重要的战略资源,对大数据进行分析与挖掘是其发展的关键。如何降低数据的维度、避免“维数灾难”是数据挖掘工作的重中之重。随着描述数据的特征维数越来越高,大量针对降维提出的粗糙集特征选择算法面临严峻挑战。群智能方法是一种新型智能优化方法,具有协作性、简单性和分布性等特点,已在粗糙集特征选择中崭露头角,并彰显出独特优势。然而,群智能方法还有一些主要问题需要解决:早熟问题广泛存在不容忽视;对于大规模优化问题,算法后期容易出现停滞;参数多凭经验设置,对具体问题和应用环境依赖性大。
因此,如何对高维大数据进行特征选择是一项充满挑战的艰巨任务。本书针对群智能的这些问题及其在粗糙集特征选择中的应用进行了研究。本书第1章为绪论,介绍特征选择的概况、研究背景和研究现状。第2章针对粗糙集和群智能的理论和经典算法进行了总结归纳,并提出一种基于群智能和粗糙集的特征选择框架。第3至5章,依据此框架,提出三种基于群智能和粗糙集的特征选择算法。第6至7章,将三种算法应用于银行个人信用评分系统与高维数据集进行特征降维。第8章进行总结和展望。
本书理论与应用相结合,力求成为从事机器学习和大数据挖掘的高校教师、研究生、科研院所的科研人员及有关工程技术人员的参考书。全书由作者独撰,共二十三万字。本书的编写受到了荆楚理工学院引进人才科研启动金项目“面向高维大数据特征降维的群智能优化算法及相关问题研究”(编号:QDB201605)的资助。在此,表示感谢!
由于作者水平有限,书中难免存在不足之处,望广大读者给予批评和指正。
作者
2018年8月
查看全部↓
精彩书摘
伴随着科技新浪潮,计算机和互联网技术日益普及,大数据时代已悄然来临。大数据即海量信息,由于数据的采集和存储变得更为便利和快捷,我们生活的世界每天产生的数据呈爆炸式增长。美国互联网数据中心的资料显示,每年在互联网上的数据以50%的比例增长。每时每刻,海量数据都在源源不断地产生。
2011年2月,《Science》杂志在社论中指出,“数据推动着科学的发展”[1]。2013年3月5日,出席全国两会的人大代表、安徽移动总经理郑杰建议将“发展大数据”上升到国家战略。他认为,发展大数据技术的关键并不仅仅是对海量数据的掌握,最重要的是如何专业化地处理这些有意义的数据。2013年3月29日倪光南院士在武汉大学“云计算与软件服务工程创新发展高峰论坛”上作《迎接大数据时代的来临》的报告,他认为,大量产生的数据加上云计算的发展,为大数据提供了合适的环境和处理能力,推动了数据挖掘、商业智能向大数据发展。数据挖掘就是为解决这一问题而产生的研究领域,它是从存放在数据库、数据仓库或其他信息库的大量数据中“挖掘”有趣知识的过程[2]。
在数据挖掘中,描述数据的特征维数越来越高,然而其中大部分特征可能和挖掘任务不相关或特征之间存在相互冗余,使得数据挖掘中学习算法的时空复杂度增高、效果变差,这种现象被称为“维数灾难”。面对“维数灾难”,如何降低维数显得非常迫切,特征选择就是一种有效的降维方法。通过特征选择,消除数据中的无关和冗余特征,不仅可以提高从大量数据中发现知识的效率,而且能够改善后期得到的分类器性能。因此,特征选择成为数据挖掘中的重要研究分支。
现实世界中的数据纷繁复杂,不可避免地存在大量的噪声、不相关和不一致性,因此,对特征选择的要求不断提高。粗糙集(Rough Set,RS)[3]理论是波兰科学院Z.Pawlak院士于1982年提出的,是一种相对较新的软计算工具,能够处理不确定和不精确信息。它在特征选择算法中得到广泛应用,已逐渐成为一种重要的特征选择理论框架。基于粗糙集的特征选择,要求最终得到的特征子集,不仅其分类能力与原始特征集合的分类能力一致,而且具有最少的基数。
查看全部↓
相关内容
Kubernetes 网络权威指南:基础、原理与实践
穿越数据的迷宫:数据管理执行指南
Flink入门与实战
大数据与指挥信息系统
OpenShift云原生架构:原理与实践
Prometheus监控技术与实践