• G拉克希米·萨拉达

      用Sadhana写的文章

    • 将连续语音自动转录为印度语言的音节单位

      G拉克希米·萨拉达 拉克希米 赫马·A·默西 T纳加拉扬

      更多详细信息 摘要 全文PDF

      本文的重点是自动将连续语音信号分割并标记为印度语的类音节单位。在该方法中,首先使用基于组延迟的算法将连续语音信号自动分割为音节单元。然后使用无监督增量训练(UIT)技术将相似的音节段分组在一起。在训练期间为每个集群生成独立风格的HMM模型。在测试期间,语音信号被分割成音节单元,然后根据训练期间获得的HMM进行测试。泰米尔语和泰卢固语的音节识别率分别为42.6%和39.94%。针对音节识别任务,探索了一种新的特征提取技术,该技术在训练和测试期间使用从多个帧大小和帧速率中提取的特征。泰米尔语和泰卢固语的识别率分别为48.7%和45.36%。标记后的切分性能优于flat起始音节识别器(泰米尔语和泰卢固语分别为27.8%和28.8%)。

  • Sadhana |新闻

    • 关于连续文章出版的编辑注释

      2019年7月25日发布

      点击在这里有关CAP模式的编辑注释

©2023-2024印度科学院,班加罗尔。