锐英源软件
第一信赖

精通

英语

开源

擅长

开发

培训

胸怀四海 

第一信赖

当前位置:锐英源 / 开源技术 / 语音识别开源 / kaldi音频格式、kaldi对清华模型进行训练出现Less than错误
服务方向
人工智能数据处理
人工智能培训
kaldi数据准备
小语种语音识别
语音识别标注
语音识别系统
语音识别转文字
kaldi开发技术服务
软件开发
运动控制卡上位机
机械加工软件
软件开发培训
Java 安卓移动开发
VC++
C#软件
汇编和破解
驱动开发
联系方式
固话:0371-63888850
手机:138-0381-0136
Q Q:396806883
微信:ryysoft

kaldi音频格式、kaldi对清华模型进行训练出现Less than错误


Less than

最近训练模型结果用于识别,在2019年完成的基础上,改下数据形式,继续训练,训练时出如下错误。

运行run出
Less than 95% the features were successfully generated

Less than 95% the features were successfully generated,运行清华的run进行模型训练,出这问题,有谁遇到过


检查一下wav. scp跟音频存储位置


另外再确认一下音频有没有问题,有可能音频损坏了
原来格式:

  • ID : 0
  • 格式 : PCM
  • 编解码器ID : 1
  • 编解码器ID/Hint : Microsoft
  • 时长 : 4s 696ms
  • 码率 : 256 Kbps
  • 声道数 : 1 channel
  • 采样率 : 16.0 KHz
  • 位深度 : 16 bits
  • 流大小 : 147 KiB (100%)

新格式

  • ID : 0
  • 格式 : PCM
  • 格式档次 : Float
  • 格式参数设置, Endianness : Float
  • 编解码器ID : 3
  • 编解码器ID/Hint : IEEE
  • 时长 : 29s 782ms
  • 码率模式 : CBR
  • 码率 : 512 Kbps
  • 声道数 : 1 channel
  • 采样率 : 16.0 KHz
  • 位深度 : 32 bits
  • 流大小 : 1.82 MiB (100%)

总结

wav格式有错误导致的,虽然有格式转换工具,但最好在录制时指定好kaldi音频格式:声道数1和采样率16.0K,位深度16位。因为是做语音识别,不需要体现声音效果,所以简单的格式适合kaldi使用。

我们锐英源对应用清华模型进行训练有丰富的经验,也有经验丰富的朋友来互相讨论,如果有语音识别开发要求,请联系。

友情链接
版权所有 Copyright(c)2004-2021 锐英源软件
公司注册号:410105000449586 豫ICP备08007559号 最佳分辨率 1024*768
地址:郑州大学北校区院(文化路97号院)内