本文的重点是自动将连续语音信号分割并标记为印度语的类音节单位。在该方法中,首先使用基于组延迟的算法将连续语音信号自动分割为音节单元。然后使用无监督增量训练(UIT)技术将相似的音节段分组在一起。在训练期间,为每个集群生成独立样式的HMM模型。在测试期间,语音信号被分割成音节单元,然后根据训练期间获得的HMM进行测试。泰米尔语和泰卢固语的音节识别率分别为42.6%和39.94%。针对音节识别任务,探索了一种新的特征提取技术,该技术在训练和测试过程中使用从多个帧大小和帧率中提取的特征。这导致泰米尔语和泰卢固语的识别率分别为48.7%和45.36%。标记后的切分性能优于flat起始音节识别器(泰米尔语和泰卢固语分别为27.8%和28.8%)。