语音计算包括处理语音信号并对其进行分析以推断信息。操作包括改变扬声器音调、检测浊音间隔和识别扬声器或语音。 Wolfram语言提供内置和完全集成的音频处理、统计分析、可视化和机器学习,从而实现简单的原型和高效的语音计算。
语音合成 —从文本合成语音信号
音频捕获 —从输入设备捕获语音信号
音频 ▪ 导入 ▪ Web音频搜索 ▪ 示例数据 ▪ 资源数据 ▪ ...
可视化
光谱图 —绘制语音信号的频谱图
倒谱 ▪ 周期图 ▪ 音频绘图
理解演讲
语音识别 —speech-to-text将语音信号转换为文本
语言识别 ▪ 演讲案例 ▪ 演讲口译员 ▪ PitchRecognize(俯仰识别) ▪ 扬声器匹配Q
语音分析
音频间隔 —查找浊音或清音间隔
音频响度 ▪ 音频本地测量 ▪ 短时傅里叶
语音操作
音频PitchShift —对语音信号应用基音偏移
音频时间拉伸 ▪ 音频频率偏移
语音合成
语音合成 —从文本中产生语音信号
语音样式数据 ▪ $语音样式
分类 —对语音信号集合进行分类
功能空间图 ▪ 功能空间三维绘图 ▪ 功能提取程序 ▪ 最近的 ▪ ...
NetModel(网络模型) —使用预训练网络进行语音分析
网络编码器 ▪ “音频” ▪ “音频MFCC” ▪ “音频熔化光谱图” ▪ ...
NetTrain公司 ▪ 选通递归层 ▪ 长短Term内存层 ▪ CTCLossLayer(CTC丢失层) ▪ ...
标签和注释
音频注释 —用分析结果注释音频对象
注释键 ▪ 注释值 ▪ 批注删除
音频微调 —提取语音信号中有趣的部分
音频加入 ▪ 音频更换 ▪ 低通滤波器 ▪ WienerFilter公司 ▪ ...