语音计算

主题
概述 »

语音计算包括处理语音信号并对其进行分析以推断信息。操作包括改变扬声器音调、检测浊音间隔和识别扬声器或语音。 Wolfram语言提供内置和完全集成的音频处理、统计分析、可视化和机器学习，从而实现简单的原型和高效的语音计算。

生成和导入语音»

语音合成 —从文本合成语音信号

音频捕获 —从输入设备捕获语音信号

音频 ▪ 导入 ▪ Web音频搜索 ▪ 示例数据 ▪ 资源数据 ▪ ...

可视化

光谱图 —绘制语音信号的频谱图

倒谱 ▪ 周期图 ▪ 音频绘图

理解演讲

语音识别 —speech-to-text将语音信号转换为文本

语言识别 ▪ 演讲案例 ▪ 演讲口译员 ▪ PitchRecognize（俯仰识别） ▪ 扬声器匹配Q

语音分析

音频间隔 —查找浊音或清音间隔

音频响度 ▪ 音频本地测量 ▪ 短时傅里叶

语音操作

音频PitchShift —对语音信号应用基音偏移

音频时间拉伸 ▪ 音频频率偏移

语音合成

语音合成 —从文本中产生语音信号

语音样式数据 ▪ $语音样式

机器学习»

分类 —对语音信号集合进行分类

功能空间图 ▪ 功能空间三维绘图 ▪ 功能提取程序 ▪ 最近的 ▪ ...

神经网络»

NetModel（网络模型） —使用预训练网络进行语音分析

网络编码器 ▪ “音频” ▪ “音频MFCC” ▪ “音频熔化光谱图” ▪ ...

NetTrain公司 ▪ 选通递归层 ▪ 长短Term内存层 ▪ CTCLossLayer（CTC丢失层） ▪ ...

标签和注释

音频注释 —用分析结果注释音频对象

注释键 ▪ 注释值 ▪ 批注删除

音频操作»

音频微调 —提取语音信号中有趣的部分

音频加入 ▪ 音频更换 ▪ 低通滤波器 ▪ WienerFilter公司 ▪ ...

顶部

Enable JavaScript to interact with content and submit forms on Wolfram websites. Learn how