音频本地测量

音频本地测量[音频,"支柱"]

计算属性"支柱"本地分区音频.

音频本地测量[音频,{"支柱₁","支柱₂",…}]

计算多个属性"支柱_我".

音频本地测量[音频,"支柱",格式]

返回指定输出中的测量值格式.

音频本地测量[视频,…]

计算中第一个音频曲目的测量值视频.

详细信息和选项

音频本地测量也称为音频特征或描述符。
音频本地测量返回一个时间序列返回每个分区的度量值。

测量值根据平均信道值进行计算。
基本直方图属性：

	“最大值”	最大值
	“最大绝对值”	最大绝对值
	“最小值”	最小值
	“MinAbs”	最小绝对值
	“最小最大值”	最小值和最大值
	“最小最大绝对值”	最小和最大绝对值
	“平均值”	平均值
	“中值”	中值
	“标准偏差”	数值的标准偏差
	“总计”	值的总和

强度属性：
“电源” 平方值的平均值

“RMS振幅” 值的均方根

“响度” 估计响度测量
响度属性使用史蒂文斯幂定律，使用.
时域属性：

	“峰值因子”	最大值除以均方根
	“熵”	值的熵
	“LPC”	线性预测系数
	“峰值与平均功率比”	最大功率除以平均功率
	“时间质心”	值的时间重心
	“过零率”	过零率
	“零交叉”	分区过零次数

这个“LPC”属性返回使用线性预测编码估计的12个系数。使用{“LPC”,n个},n个返回系数。
LPC系数通常用于语音信号的分析和编码。
时间重心属性给出了每个分区的能量重心。时间质心0.5表示分区的中心，而0和1表示分区的开始和结束。
频域属性：

	“基本频率”	估计基频
	“福尔马特”	信号共振峰的频率
	“高频内容”	线性加权功率谱的平均值
	“MFCC”	Mel频率倒谱系数
	“光谱质心”	功率谱重心
	“特殊休息”	最大值除以功率谱平均值
	“光谱平坦度”	几何平均值除以功率谱平均值
	“光谱峰度”	震级谱峰度
	“光谱滚动”	能量集中的频率
	“光谱偏斜”	震级谱偏度
	“光谱斜率”	估计的幅度谱斜率
	“频谱扩散”	功率谱带宽的测量

使用{“基本频率”,thr（星期三）,明弗雷克,最大频率}，仅在置信度为的情况下检测到的频率thr（星期三）或频率范围更高明弗雷克和最大频率返回。默认值针对包括语音和乐器在内的信号进行了优化。
使用{“蚁族”,n个,米}，最多n个共振峰返回使用米LPC系数。默认情况下，和米取决于输入采样率。
MFCC属性返回13个系数。使用{“MFCC”,n个,米,明弗雷克,最大频率},n个系数返回使用米频率范围内的滤波器明弗雷克和最大频率.
在连续分区上计算的频域属性：

	“ComplexDomainDistance”	预测傅立叶和测量傅立叶之间的距离
	“修改的KullbackLeibler”	改良Kullback–光谱之间的莱布勒距离
	“新颖性”	重大变化的估计度量
	“相位偏差”	预测和测量傅里叶相位差
	“光谱通量”	连续谱差范数

语音属性：
“语音活动” 是否检测到语音活动(0和1)
扬声器属性：
“演讲技巧” 非周期的(嘈杂的)成分

“演讲基本频率” 基频

“语音频谱包络” 平滑谱图数据
默认情况下，返回属性值列表。其他格式规范包括：

	自动	自动确定输出
	“关联”	将结果格式化为协会
	“数据集”	将结果格式化为数据集
	“列表”	将结果格式化为列表
	“规则列表”	将结果格式化为规则表达

可以提供以下选项：

对齐	居中	时间戳与分区的对齐
Fourier参数	{-1,1}	傅里叶参数
衬垫	自动	填充方案
填充大小	自动	填充量
分区粒度	自动	音频分区规范
元信息	无	包括其他元信息
MissingDataMethod（丢失数据方法）	无	用于缺少值的方法
重新采样方法	自动	用于重新采样路径的方法

默认情况下，测量值返回到每个分区的中心。使用对齐选项，可以在开始时返回测量值(左侧)或结束(赖特)每个分区的。
默认情况下，信号在两端填充一半的分区大小，并保持静默。有关的可能设置衬垫，请参阅参考页AudioPad（音频板）.

示例

全部打开全部关闭

基本示例 (3)

计算音频对象的RMS振幅：

绘制测量结果：

计算视频对象：

绘制测量结果：

计算多个测量值：

绘制测量值：

范围 (24)

基本用途 (1)

将输出格式化为协会:

返回的列表时间序列:

返回规则列表：

返回a数据集:

直方图属性 (2)

基本直方图属性：

统计直方图属性：

强度属性 (1)

基于强度的基本特性：

时域属性 (6)

这个“CrestFactor属性测量分区上最大值与RMS的比率。“峰值与平均功率比”计算相同值的平方：

这个“时间质心”属性计算每个分区的能量分布的重心：

输出值绑定在0和1之间，其中0表示所有能量都集中在分区的开头。

“零交叉”返回分区中的零交叉数；“过零率”根据分区的持续时间对其进行规范化：

这个“LPC”属性返回使用线性预测编码估计的12个系数：

控制具有高采样率的音频对象的LPC系数数：

提取信号共振峰的频率：

控制用于计算的共振峰和LPC系数的数量：

音频信号的熵：

频域属性 (8)

“光谱峰”测量功率谱的最大值和平均值之间的比率：

“光谱滚动”测量频谱95%能量集中在以下的频率：

“光谱斜率”是功率谱斜率的度量：

“光谱平坦度”是功率谱平坦度的度量：

根据功率谱计算的常见统计特性：

这个“基本频率”估计单声道声音的基频：

控制检测灵敏度：

控制执行检测的频率范围：

“高频内容”使用随频率线性增加的权重计算功率谱的平均值：

谱的线性加权赋予谱的高端事件更大的重要性，使“高频内容”一个很好的瞬态检测候选者。

这个“MFCC”属性返回mel-frequency倒谱的12个系数：

控制系数的数量和滤波器的数量，以及频率范围：

相邻分区上计算的频域特性 (2)

基于两个连续帧的傅里叶变换之间距离的不同度量的属性：

这个“新颖性”属性计算帧与相邻帧的差异：

语音和扬声器属性 (4)

这个“语音活动”属性是语音信号的浊音部分的指示符函数：

用音频波形图显示语音活动：

使用较小的10毫秒窗口提高分辨率：

这个“演讲基本频率”属性估计语音的基本频率：

这个“语音频谱包络”属性返回信号频谱包络的系数：

绘制结果值：

这个“演讲技巧”属性返回信号的非周期分量的系数：

绘制结果值：

选项 (5)

对齐 (1)

结果的时间戳时间序列默认情况下位于每个分区的中心：

使用对齐->赖特要将计算的属性放置在每个分区的末尾，请执行以下操作：

衬垫 (1)

默认情况下，“无声”使用填充：

使用“反向”衬垫：

填充大小 (1)

默认情况下，在信号的两端应用等于分区大小一半的填充：

增加填充量：

在信号的开头和结尾使用不同的填充量：

分区粒度 (2)

指定100毫秒的分区大小：

使用10 ms的偏移：

使用平滑窗口：

默认情况下，所有频域属性都使用平滑窗口：

应用 (4)

检测复杂音频信号中的瞬态：

通过对原始信号的几个测量值求平均值来计算“检测函数”：

使用自适应阈值过滤检测功能：

查找过滤检测功能的峰值：

在波形上绘制检测到的瞬态：

计算音频对象的签名：

计算MFCC特征并提取值：

绘制生成的距离矩阵：

使用动态时间扭曲比较同一句子的两段录音：

计算并绘制录制的MFCC特征：

使用计算两个记录之间的动态时间扭曲对应关系Warping通信:

绘制两个记录之间的对应关系：

使用“MFCC”测量作为一种特征，用于计算示例数据[“音频”]集合：

可能的问题 (1)

“基本频率”返回一个缺少[]无法估计基频的分区的值（帧可能包含静音或多音）：

合成音的基频未定义：

整洁的示例 (3)

使用音频发生器:

计算“RMS振幅”和“基本频率”测量值：

使用“基本频率”控制结果频率的测量：

使用“RMS振幅”控制振幅的测量：

解码莫尔斯信号：

计算信号的RMS振幅并四舍五入：

仅选择存在瞬态的点：

确保第一个点位于t吨=0并计算最小时间增量：

定义莫尔斯电码映射：

解码信号：

创建音频对象波形的三维可渲染模型：

计算“最小值”和“最大值”测量值：

创建波形的3D模型：

三维打印模型：

顶部

音频本地测量

详细信息和选项

示例

基本示例 (3)

范围 (24)

基本用途 (1)

直方图属性 (2)

强度属性 (1)

时域属性 (6)

频域属性 (8)

相邻分区上计算的频域特性 (2)

语音和扬声器属性 (4)

选项 (5)

对齐 (1)

衬垫 (1)

填充大小 (1)

分区粒度 (2)

应用 (4)

可能的问题 (1)

整洁的示例 (3)

文本

CMS公司

亚太地区

BibTeX公司

BibLaTeX公司

	“电源”	平方值的平均值
	“RMS振幅”	值的均方根
	“响度”	估计响度测量

	“演讲技巧”	非周期的(嘈杂的)成分
	“演讲基本频率”	基频
	“语音频谱包络”	平滑谱图数据

音频本地测量

详细信息和选项

示例

基本示例 (3)

范围 (24)

基本用途 (1)

直方图属性 (2)

强度属性 (1)

时域属性 (6)

频域属性 (8)

相邻分区上计算的频域特性 (2)

语音和扬声器属性 (4)

选项 (5)

对齐 (1)

衬垫 (1)

填充大小 (1)

分区粒度 (2)

应用 (4)

可能的问题 (1)

整洁的示例 (3)

另请参阅

相关指南

历史

文本

CMS公司

亚太地区

BibTeX公司

BibLaTeX公司