语音识别ASR开源、语音识别ASR技术、语音识别ASR开源项目和语音识别ASR产品快速开发

当前位置：锐英源 / 开源技术 / 语音识别ASR开源社区，欢迎加语音识别QQ群：14372360

开源实力展示

Kaldi

Kaldi 的文档覆盖全面，包括了语音识别解决方案中的语音和深度学习方法

CMU Sphinx

CMU Sphinx源于卡内基梅隆大学，文档简单易读，且贴近实践操作

DNN

深度神经网络（DNN）是在输入和输出层之间具有多个隐藏层的ANN。

pykaldi2

序列训练，用识别结果扩充训练模型，服务器分析输出优化前端输入机制

语音识别ASR开源

　　语音识别ASR技术将声音转化为文字，大大减轻了普通人的输入压力，使IT产品更容易让普通人使用，比如手机里的语音唤醒功能。
　　语音识别ASR的2个重要部分是语音和语言模型和识别算法，语音和语言模型是查找匹配目标，识别算法根据特征值进行反复多层的匹配来确定结果。
　　语音和语言模型要进行精心的组织，组织完要进行训练，训练后要用测试样本确定识别成功率，成功率低的话还要重新录制和组织，所以说语音和语言模型比较重要。
　　识别算法从HMM到DNN等等，也逐渐成熟，性能也满足了要求，识别率方面也能有效提升。
　　语音识别ASR开源项目里知名的有CMU Sphinx和kaldi等等，kaldi新，支持的模型更多，比如阿里巴巴的模型，所以功能更好用一些。这2个开源项目锐英源都用过。

产品