农产品信息采集作业场景下的语音识别鲁棒性研究pdf下载

农产品信息采集作业场景下的语音识别鲁棒性研究百度网盘pdf下载

作者:
简介:农产品信息采集作业场景下的语音识别鲁棒性研究
出版社:电子工业出版社
出版时间:2018-04-01
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

内容简介
  本书介绍了在农业产品信息采集领域开展语音识别鲁棒性研究的基础、原理、方法和应用,以及该研究领域近年来取得的一些研究成果和技术。全书共分12章,包括绪论、基于隐马尔可夫模型的语音识别、手持设备的资源约束及语音识别应用部署、支持向量机的语音识别模型、支持向量机声学模型的分析及改进、噪声语音频谱幅度的非线性压缩方法评估、农产品信息采集语音识别语法规则、利用HTK搭建农产品价格语音识别系统、语音识别系统的三音子模型优化及特征规整、联合谱减增强和失真补偿的谱减方法、基于统计模型的前端增强方法与失真补偿等内容。
作者简介
  赵俊峰博士,宁夏大学信息工程学院副教授,主要从事计算机应用、软件工程及面向人工智能应用的设计研究工作,具有丰富的教学与科研经验。
目录
版权信息
前言
英文缩略词表
第1章 农产品信息采集语音识别的起源
1.1 研究背景及意义
1.2 国内外研究现状及发展动态分析
1.3 语音识别概述
1.3.1 语音识别的定义及基本模型
1.3.2 语音识别的分类及应用
1.3.3 语音识别方法
1.4 语音识别及声学技术在农业领域的应用
第2章 基于HMM的语音识别
2.1 HMM的语音识别框架
2.1.1 特征提取
2.1.2 HMM声学模型
2.1.3 解码和词图生成
2.2 HTK工具介绍
2.2.1 HTK软件架构
2.2.2 HTK工具包
2.3 结论
第3章 手持设备的资源约束及语音识别应用部署
3.1 语音识别系统在手持设备和网络上的部署
3.1.1 手持设备的语音识别
3.1.2 手持设备语音识别的资源约束
3.1.3 手持设备语音识别的通信网络约束
3.1.4 语音识别在设备和通信网络上的架构方案
3.2 嵌入式语音识别
3.2.1 嵌入式语音识别的前景
3.2.2 嵌入式语音识别的应用及平台
3.2.3 嵌入式定点运算
3.2.4 嵌入式语音识别优化
3.2.5 嵌入式语音识别的鲁棒性
3.3 结论
第4章 支持向量机的语音识别模型研究
4.1 支持向量机的理论基础
4.1.1 机器学习问题的数学模型
4.1.2 支持向量机的问题描述
4.1.3 支持向量机的核函数
4.1.4 支持向量机的多分类算法
4.1.5 支持向量机的工作流程
4.2 支持向量机模型参数的选择方法
4.2.1 错误惩罚因子的选择
4.2.2 核函数的选择
4.2.3 训练时间与词汇量的关系
4.3 结论
第5章 支持向量机声学模型的分析及改进
5.1 支持向量机声学模型的训练算法
5.1.1 支持向量机训练模型
5.1.2 序列最小优化算法(SMO)
5.1.3 改进的SMO算法
5.1.4 大数据量SVM训练
5.2 支持向量机的Senone判别
5.2.1 Senone的定义
5.2.2 选择Senone建模单元
5.2.3 后验概率
5.3 改进的HMM/SVM混合识别模型
5.3.1 改进模型的思路
5.3.2 改进模型的设计
5.3.3 改进混合模型的多分类器设计
5.3.4 SVMs距离到后验概率的计算方法
5.3.5 SVMs/sigmoid混合训练模型
5.4 实验及结果
5.4.1 实验一:分类方法对比实验
5.4.2 实验二:错误惩罚因子的参数调优实验
5.4.3 实验三:改进SMO算法的性能比较
5.4.4 实验四:改进HMM/SVM混合模型实验
5.5 结论
第6章 噪声语音频谱幅度的非线性压缩方法评估
6.1 背景
6.2 非线性
6.2.1 基线系统
6.2.2 非线性压缩
6.2.3 混合函数
6.3 实验及结果
6.3.1 实验一:控制实验
6.3.2 实验二:基线范围函数
6.3.3 实验三:非线性压缩
6.3.4 实验四:混合函数
6.3.5 实验五:对比实验
6.4 结论
第7章 农产品信息采集语音识别语法规则
7.1 信息采集语音识别语法
7.1.1 基本概念
7.1.2 语法形式
7.2 语法文档及规则
7.2.1 语法文档
7.2.2 规则定义和引用
7.2.3 语法处理及转换规则设计
7.3 结论
第8章 利用HTK搭建农产品价格语音识别系统
8.1 数据准备
8.1.1 语法定义
8.1.2 字典定义
8.1.3 录制语音数据
8.1.4 创建录音脚本文件
8.1.5 数据特征提取
8.2 创建单音素HMM模型
8.2.1 创建一致初始法的单因素HMM
8.2.2 修补哑音模型
8.2.3 训练数据校准
8.3 创建绑定状态的三音子
8.3.1 建立三音素HMM
8.3.2 三音素状态绑定
8.4 识别器评估
8.4.1 识别测试
8.4.2 实时识别
8.5 自适应HMM
8.5.1 自适应数据的准备
8.5.2 生成变换
8.5.3 评估自适应系统性能
8.6 自适应训练
8.7 总结
第9章 系统的三音子模型优化及特征规整
9.1 扩展的声/韵母建模基元
9.2 基于决策树的状态共享
9.2.1 决策树的构造
9.2.2 二值问题集的设计
9.2.3 节点分裂准则
9.2.4 节点停止分裂
9.2.5 节点合并
9.3 增加高斯混合分量
9.4 倒谱特征归一化
9.5 实验及分析
9.5.1 实验一:三音子模型识别实验
9.5.2 实验二:决策树状态聚类
9.5.3 实验三:高斯混合分量增加
9.5.4 实验四:倒谱均值方差归一化(CMVN)
9.6 总结
第10章 联合谱减增强和失真补偿的鲁棒性方法
10.1 谱减法
10.1.1 谱减的基本原理
10.1.2 使用过减(Over Subtraction)技术的谱减算法
10.2 多带(Multiband)谱减法
10.3 MMSE谱减算法
10.4 实验
10.4.1 实验一:MMSE谱减法参数优化实验
10.4.2 实验二:不同环境下联合算法实验
10.5 总结
第11章 基于统计模型的前端增强方法与失真补偿的结合
11.1 MMSE幅度谱估计
11.1.1 MMSE幅度估计器
11.1.2 先验SNR的估计
11.2 对数MMSE估计器
11.3 MMSE估计的实现和评估
11.4 实验
11.4.1 实验一:采用MMSE估计器与logMMSE方法增强
11.4.2 实验二:MMSE、logMMSE与CMVN联合实验
11.4.3 实验三:实际环境语音测试
11.5 算法综合比较
11.6 总结
第12章 结论
12.1 本研究的主要工作
12.2 进一步的研究方向
参考文献