音频本地测量
详细信息和选项
音频本地测量 也称为音频特征或描述符。 音频本地测量 返回一个 时间序列 返回每个分区的度量值。 测量值根据平均信道值进行计算。 基本直方图属性: -
“最大值” 最大值 “最大绝对值” 最大绝对值 “最小值” 最小值 “MinAbs” 最小绝对值 “最小最大值” 最小值和最大值 “最小最大绝对值” 最小和最大绝对值 “平均值” 平均值 “中值” 中值 “标准偏差” 数值的标准偏差 “总计” 值的总和 强度属性: -
“电源” 平方值的平均值 “RMS振幅” 值的均方根 “响度” 估计响度测量 响度属性使用史蒂文斯幂定律,使用 . 时域属性: -
“峰值因子” 最大值除以均方根 “熵” 值的熵 “LPC” 线性预测系数 “峰值与平均功率比” 最大功率除以平均功率 “时间质心” 值的时间重心 “过零率” 过零率 “零交叉” 分区过零次数 这个 “LPC” 属性返回使用线性预测编码估计的12个系数。 使用 { “LPC” , n个 } , n个 返回系数。 LPC系数通常用于语音信号的分析和编码。 时间重心属性给出了每个分区的能量重心。 时间质心0.5表示分区的中心,而0和1表示分区的开始和结束。 频域属性: -
“基本频率” 估计基频 “福尔马特” 信号共振峰的频率 “高频内容” 线性加权功率谱的平均值 “MFCC” Mel频率倒谱系数 “光谱质心” 功率谱重心 “特殊休息” 最大值除以功率谱平均值 “光谱平坦度” 几何平均值除以功率谱平均值 “光谱峰度” 震级谱峰度 “光谱滚动” 能量集中的频率 “光谱偏斜” 震级谱偏度 “光谱斜率” 估计的幅度谱斜率 “频谱扩散” 功率谱带宽的测量 使用 { “基本频率” , thr(星期三) , 明弗雷克 , 最大频率 } ,仅在置信度为的情况下检测到的频率 thr(星期三) 或频率范围更高 明弗雷克 和 最大频率 返回。 默认值针对包括语音和乐器在内的信号进行了优化。 使用 { “蚁族” , n个 , 米 } ,最多 n个 共振峰返回使用 米 LPC系数。 默认情况下, 和 米 取决于输入采样率。 MFCC属性返回13个系数。 使用 { “MFCC” , n个 , 米 , 明弗雷克 , 最大频率 } , n个 系数返回使用 米 频率范围内的滤波器 明弗雷克 和 最大频率 . 在连续分区上计算的频域属性: -
“ComplexDomainDistance” 预测傅立叶和测量傅立叶之间的距离 “修改的KullbackLeibler” 改良Kullback – 光谱之间的莱布勒距离 “新颖性” 重大变化的估计度量 “相位偏差” 预测和测量傅里叶相位差 “光谱通量” 连续谱差范数 语音属性: -
“语音活动” 是否检测到语音活动 ( 0和1 ) 扬声器属性: -
“演讲技巧” 非周期的 ( 嘈杂的 ) 成分 “演讲基本频率” 基频 “语音频谱包络” 平滑谱图数据 默认情况下,返回属性值列表。 其他 格式 规范包括: -
自动 自动确定输出 “关联” 将结果格式化为 协会 “数据集” 将结果格式化为 数据集 “列表” 将结果格式化为 列表 “规则列表” 将结果格式化为 规则 表达 可以提供以下选项: -
对齐 居中 时间戳与分区的对齐 Fourier参数 { -1 , 1 } 傅里叶参数 衬垫 自动 填充方案 填充大小 自动 填充量 分区粒度 自动 音频分区规范 元信息 无 包括其他元信息 MissingDataMethod(丢失数据方法) 无 用于缺少值的方法 重新采样方法 自动 用于重新采样路径的方法 默认情况下,测量值返回到每个分区的中心。 使用 对齐 选项,可以在开始时返回测量值( 左侧 )或结束( 赖特 )每个分区的。 默认情况下,信号在两端填充一半的分区大小,并保持静默。 有关的可能设置 衬垫 ,请参阅参考页 AudioPad(音频板) .