开源实力展示
Kaldi 的文档覆盖全面,包括了语音识别解决方案中的语音和深度学习方法
CMU Sphinx源于卡内基梅隆大学,文档简单易读,且贴近实践操作
语音识别ASR开源
语音识别ASR技术将声音转化为文字,大大减轻了普通人的输入压力,使IT产品更容易让普通人使用,比如手机里的语音唤醒功能。
语音识别ASR的2个重要部分是语音和语言模型和识别算法,语音和语言模型是查找匹配目标,识别算法根据特征值进行反复多层的匹配来确定结果。
语音和语言模型要进行精心的组织,组织完要进行训练,训练后要用测试样本确定识别成功率,成功率低的话还要重新录制和组织,所以说语音和语言模型比较重要。
识别算法从HMM到DNN等等,也逐渐成熟,性能也满足了要求,识别率方面也能有效提升。
语音识别ASR开源项目里知名的有CMU Sphinx和kaldi等等,kaldi新,支持的模型更多,比如阿里巴巴的模型,所以功能更好用一些。这2个开源项目锐英源都用过。
语音识别ASR的2个重要部分是语音和语言模型和识别算法,语音和语言模型是查找匹配目标,识别算法根据特征值进行反复多层的匹配来确定结果。
语音和语言模型要进行精心的组织,组织完要进行训练,训练后要用测试样本确定识别成功率,成功率低的话还要重新录制和组织,所以说语音和语言模型比较重要。
识别算法从HMM到DNN等等,也逐渐成熟,性能也满足了要求,识别率方面也能有效提升。
语音识别ASR开源项目里知名的有CMU Sphinx和kaldi等等,kaldi新,支持的模型更多,比如阿里巴巴的模型,所以功能更好用一些。这2个开源项目锐英源都用过。