• 北大核心期刊(《中文核心期刊要目总览》2017版)
  • 中国科技核心期刊(中国科技论文统计源期刊)
  • JST 日本科学技术振兴机构数据库(日)收录期刊

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于循环神经网络的音素识别研究

黎长江 胡燕

黎长江, 胡燕. 基于循环神经网络的音素识别研究[J]. 微电子学与计算机, 2017, 34(8): 47-51.
引用本文: 黎长江, 胡燕. 基于循环神经网络的音素识别研究[J]. 微电子学与计算机, 2017, 34(8): 47-51.
LI Chang-jiang, HU Yan. Research of Phoneme Recognition Based on Recurrent Neural Network[J]. Microelectronics & Computer, 2017, 34(8): 47-51.
Citation: LI Chang-jiang, HU Yan. Research of Phoneme Recognition Based on Recurrent Neural Network[J]. Microelectronics & Computer, 2017, 34(8): 47-51.

基于循环神经网络的音素识别研究

详细信息
    作者简介:

    黎长江,男,(1991-),硕士研究生.研究方向为语音识别.E-mail:jonathan.l@qq.com.

    胡燕,女,(1965-),教授,硕士生导师.研究方向为智能信息检索.

  • 中图分类号: TP391.42

Research of Phoneme Recognition Based on Recurrent Neural Network

  • 摘要: 基于隐马尔科夫模型(HMM)和循环神经网络(RNN)的HMM-RNN混合模型在语音识别中取得了很大的成功.然而使用HMM需要知道每一帧对应的标签才能进行有效的训练,在数据的准备阶段需要将语音进行预对齐;另一方面,在语音信号的分帧过程中,相邻帧有1/2-1/3的重合部分,由于RNN的计算过程本身就是上下文相关的,相邻帧的重合部分增加了整个系统的训练时间.针对上述问题,使用连接时序分类(CTC)来代替HMM跟RNN结合,并在语音分帧过程中去除相邻帧之间的重合部分,使用TIMIT语音数据集,进行音素上的识别任务,并且实验结果表明CTC-BLSTM模型在音素上的识别率要高于HMM-BLSTM混合模型,CTC-BSLTM在去除帧重合后能够大幅提高系统的训练效率并且保证识别率大致相同.

     

  • 加载中
计量
  • 文章访问数:  3391
  • HTML全文浏览量:  184
  • PDF下载量:  35
  • 被引次数: 0
出版历程
  • 收稿日期:  2016-11-20
  • 修回日期:  2016-12-23
  • 刊出日期:  2017-08-05

目录

    /

    返回文章
    返回