语音识别和图像识别的区别

2020-10-28 科技 97阅读
语音识别与图像识别的区别:
1)语音识别分很多种:命令识别,离散/连续语音识别,特定人/非特定人+离散/连续+语音识别
2)命令、离散识别,有些方法 跟 图像识别 还有些像,连续语音识别差得就很多了
连续语音识别常用识别方法:
GMM/DNN/CNN+HMM,HMM用来处理时间维度上的关系,GMM/DNN/CNN用来做声学建模,解码还需要用到语言模型(Language
Model);非特定人,跟transfer learning还有点关系。
总之:语音识别要比图像识别复杂得多,图像识别的基本套路就是“特征提取+训练分类器(神经网络把这俩统一了)”,语音识别还需要处理时间维度上信息的变化
声明:你问我答网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系fangmu6661024@163.com