音频本地测量

音频本地测量[音频,"支柱"]

计算属性"支柱"本地分区音频.

音频本地测量[音频,{"支柱1","支柱2",}]

计算多个属性"支柱".

音频本地测量[音频,"支柱",格式]

返回指定输出中的测量值格式.

音频本地测量[视频,]

计算中第一个音频曲目的测量值视频.

详细信息和选项

  • 音频本地测量也称为音频特征或描述符。
  • 音频本地测量返回一个时间序列返回每个分区的度量值。
  • 测量值根据平均信道值进行计算。
  • 基本直方图属性:
  • “最大值”最大值
    “最大绝对值”最大绝对值
    “最小值”最小值
    “MinAbs”最小绝对值
    “最小最大值”最小值和最大值
    “最小最大绝对值”最小和最大绝对值
    “平均值”平均值
    “中值”中值
    “标准偏差”数值的标准偏差
    “总计”值的总和
  • 强度属性:
  • “电源”平方值的平均值
    “RMS振幅”值的均方根
    “响度”估计响度测量
  • 响度属性使用史蒂文斯幂定律,使用.
  • 时域属性:
  • “峰值因子”最大值除以均方根
    “熵”值的熵
    “LPC”线性预测系数
    “峰值与平均功率比”最大功率除以平均功率
    “时间质心”值的时间重心
    “过零率”过零率
    “零交叉”分区过零次数
  • 这个“LPC”属性返回使用线性预测编码估计的12个系数。使用{“LPC”,n个},n个返回系数。
  • LPC系数通常用于语音信号的分析和编码。
  • 时间重心属性给出了每个分区的能量重心。时间质心0.5表示分区的中心,而0和1表示分区的开始和结束。
  • 频域属性:
  • “基本频率”估计基频
    “福尔马特”信号共振峰的频率
    “高频内容”线性加权功率谱的平均值
    “MFCC”Mel频率倒谱系数
    “光谱质心”功率谱重心
    “特殊休息”最大值除以功率谱平均值
    “光谱平坦度”几何平均值除以功率谱平均值
    “光谱峰度”震级谱峰度
    “光谱滚动”能量集中的频率
    “光谱偏斜”震级谱偏度
    “光谱斜率”估计的幅度谱斜率
    “频谱扩散”功率谱带宽的测量
  • 使用{“基本频率”,thr(星期三),明弗雷克,最大频率},仅在置信度为的情况下检测到的频率thr(星期三)或频率范围更高明弗雷克最大频率返回。默认值针对包括语音和乐器在内的信号进行了优化。
  • 使用{“蚁族”,n个,},最多n个共振峰返回使用LPC系数。默认情况下,取决于输入采样率。
  • MFCC属性返回13个系数。使用{“MFCC”,n个,,明弗雷克,最大频率},n个系数返回使用频率范围内的滤波器明弗雷克最大频率.
  • 在连续分区上计算的频域属性:
  • “ComplexDomainDistance”预测傅立叶和测量傅立叶之间的距离
    “修改的KullbackLeibler”改良Kullback光谱之间的莱布勒距离
    “新颖性”重大变化的估计度量
    “相位偏差”预测和测量傅里叶相位差
    “光谱通量”连续谱差范数
  • 语音属性:
  • “语音活动”是否检测到语音活动(0和1)
  • 扬声器属性:
  • “演讲技巧”非周期的(嘈杂的)成分
    “演讲基本频率”基频
    “语音频谱包络”平滑谱图数据
  • 默认情况下,返回属性值列表。其他格式规范包括:
  • 自动自动确定输出
    “关联”将结果格式化为协会
    “数据集”将结果格式化为数据集
    “列表”将结果格式化为列表
    “规则列表”将结果格式化为规则表达
  • 可以提供以下选项:
  • 对齐 居中时间戳与分区的对齐
    Fourier参数{-1,1}傅里叶参数
    衬垫 自动填充方案
    填充大小 自动填充量
    分区粒度 自动音频分区规范
    元信息包括其他元信息
    MissingDataMethod(丢失数据方法)用于缺少值的方法
    重新采样方法自动用于重新采样路径的方法
  • 默认情况下,测量值返回到每个分区的中心。使用对齐选项,可以在开始时返回测量值(左侧)或结束(赖特)每个分区的。
  • 默认情况下,信号在两端填充一半的分区大小,并保持静默。有关的可能设置衬垫,请参阅参考页AudioPad(音频板).

示例

全部打开全部关闭

基本示例  (3)

计算音频对象的RMS振幅:

绘制测量结果:

计算视频对象:

绘制测量结果:

计算多个测量值:

绘制测量值:

范围  (24)

基本用途  (1)

将输出格式化为协会:

返回的列表时间序列:

返回规则列表:

返回a数据集:

直方图属性  (2)

基本直方图属性:

统计直方图属性:

强度属性  (1)

基于强度的基本特性:

时域属性  (6)

这个“CrestFactor属性测量分区上最大值与RMS的比率。“峰值与平均功率比”计算相同值的平方:

这个“时间质心”属性计算每个分区的能量分布的重心:

输出值绑定在0和1之间,其中0表示所有能量都集中在分区的开头。

“零交叉”返回分区中的零交叉数;“过零率”根据分区的持续时间对其进行规范化:

这个“LPC”属性返回使用线性预测编码估计的12个系数:

控制具有高采样率的音频对象的LPC系数数:

提取信号共振峰的频率:

控制用于计算的共振峰和LPC系数的数量:

音频信号的熵:

频域属性  (8)

“光谱峰”测量功率谱的最大值和平均值之间的比率:

“光谱滚动”测量频谱95%能量集中在以下的频率:

“光谱斜率”是功率谱斜率的度量:

“光谱平坦度”是功率谱平坦度的度量:

根据功率谱计算的常见统计特性:

这个“基本频率”估计单声道声音的基频:

控制检测灵敏度:

控制执行检测的频率范围:

“高频内容”使用随频率线性增加的权重计算功率谱的平均值:

谱的线性加权赋予谱的高端事件更大的重要性,使“高频内容”一个很好的瞬态检测候选者。

这个“MFCC”属性返回mel-frequency倒谱的12个系数:

控制系数的数量和滤波器的数量,以及频率范围:

相邻分区上计算的频域特性  (2)

基于两个连续帧的傅里叶变换之间距离的不同度量的属性:

这个“新颖性”属性计算帧与相邻帧的差异:

语音和扬声器属性  (4)

这个“语音活动”属性是语音信号的浊音部分的指示符函数:

用音频波形图显示语音活动:

使用较小的10毫秒窗口提高分辨率:

这个“演讲基本频率”属性估计语音的基本频率:

这个“语音频谱包络”属性返回信号频谱包络的系数:

绘制结果值:

这个“演讲技巧”属性返回信号的非周期分量的系数:

绘制结果值:

选项  (5)

对齐  (1)

结果的时间戳时间序列默认情况下位于每个分区的中心:

使用对齐->赖特要将计算的属性放置在每个分区的末尾,请执行以下操作:

衬垫  (1)

默认情况下,“无声”使用填充:

使用“反向”衬垫:

填充大小  (1)

默认情况下,在信号的两端应用等于分区大小一半的填充:

增加填充量:

在信号的开头和结尾使用不同的填充量:

分区粒度  (2)

指定100毫秒的分区大小:

使用10 ms的偏移:

使用平滑窗口:

默认情况下,所有频域属性都使用平滑窗口:

应用  (4)

检测复杂音频信号中的瞬态:

通过对原始信号的几个测量值求平均值来计算“检测函数”:

使用自适应阈值过滤检测功能:

查找过滤检测功能的峰值:

在波形上绘制检测到的瞬态:

计算音频对象的签名:

计算MFCC特征并提取值:

绘制生成的距离矩阵:

使用动态时间扭曲比较同一句子的两段录音:

计算并绘制录制的MFCC特征:

使用计算两个记录之间的动态时间扭曲对应关系Warping通信:

绘制两个记录之间的对应关系:

使用“MFCC”测量作为一种特征,用于计算示例数据[“音频”]集合:

可能的问题  (1)

“基本频率”返回一个缺少[]无法估计基频的分区的值(帧可能包含静音或多音):

合成音的基频未定义:

整洁的示例  (3)

使用音频发生器:

计算“RMS振幅”“基本频率”测量值:

使用“基本频率”控制结果频率的测量:

使用“RMS振幅”控制振幅的测量:

解码莫尔斯信号:

计算信号的RMS振幅并四舍五入:

仅选择存在瞬态的点:

确保第一个点位于t吨=0并计算最小时间增量:

定义莫尔斯电码映射:

解码信号:

创建音频对象波形的三维可渲染模型:

计算“最小值”“最大值”测量值:

创建波形的3D模型:

三维打印模型:

Wolfram Research(2016),音频本地测量,Wolfram语言功能,https://reference.wolfram.com/language/ref/AudioLocalMeasurements.html(2024年更新)。

文本

Wolfram Research(2016),AudioLocalMeasurements,Wolfram语言函数,https://reference.wolfram.com/language/ref/AudioLocalMeasurements.html(2024年更新)。

CMS公司

沃尔夫拉姆语言。2016年,“音频本地测量”,Wolfram语言与系统文档中心。Wolfram研究。上次修改时间:2024年。https://reference.wolfram.com/language/ref/AudioLocalMeasurements.html。

亚太地区

沃尔夫拉姆语言。(2016). 音频本地测量。Wolfram语言与系统文档中心。检索自https://reference.wolfram.com/language/ref/AudioLocalMeasurements.html

BibTeX公司

@misc{reference.wolfram_2024_audiolocalmeasurements,author=“wolfram Research”,title=“{audiolocalmeasurements}”,year=“2024”,howpublished=“\url{https://reference.wolfram.com/language/ref/audiolocalmeasurements.html}”,note=[访问时间:2024年9月21日]}

BibLaTeX公司

@在线{reference.wolfram_2024_audiolocalmeasurements,organization={wolfram Research},title={audiolocalmeasurements},year={2024},url={https://reference.wolfram.com/language/ref/AudioLocalMeansurements.html},note=[访问时间:2024年9月21日]}