标签:blank 映射 提取 ios 运算 min bin target nal
pyaudio有这么几个功能:
- 提取特征
- 训练并且使用分类器
- 语音分割功能
- 内容关系可视化
python实现,好处有这么几个
- 适合做计算分析类型操作(编码少,效率不低)
- 免费
- 不需要很复杂的搭环境
- 大量的第三方库可以使用
所有的短时间特征可以见下图
过程:语音信号分帧,一帧有34个特征。一般20~100ms
中等长度特征(mid-term features)和特别长的特征(long-term features)
速度有关的特征
pyaudio提供了两类的语音分割
- 有监督的语音分割:需要有提供一些材料,例如,已经训练好的分类器。为此,此库提供了两种算法:分类的方法和隐马尔科夫的算法
- 无监督的语音分割:无监督的或者半监督的,不需要提供知识准备,主要的例子是静音检测,语音聚类,语音缩略图
隐马尔科夫模型分割算法(HMM-based segmentation)
静音检测
标签:blank 映射 提取 ios 运算 min bin target nal
原文地址:http://www.cnblogs.com/demo-deng/p/7526639.html