锐英源软件
第一信赖

精通

英语

开源

擅长

开发

培训

胸怀四海 

第一信赖

当前位置:锐英源 / 开源技术 / 语音识别ASR开源社区,欢迎加语音识别QQ群:14372360
开源实力展示
经验培训
Kaldi

Kaldi

Kaldi 的文档覆盖全面,包括了语音识别解决方案中的语音和深度学习方法

CMU Sphinx

CMU Sphinx源于卡内基梅隆大学,文档简单易读,且贴近实践操作

Kaldi

DNN

深度神经网络(DNN)是在输入和输出层之间具有多个隐藏层的ANN。

pykaldi2

序列训练,用识别结果扩充训练模型,服务器分析输出优化前端输入机制

语音识别ASR开源
   语音识别ASR技术将声音转化为文字,大大减轻了普通人的输入压力,使IT产品更容易让普通人使用,比如手机里的语音唤醒功能。
   语音识别ASR的2个重要部分是语音和语言模型和识别算法,语音和语言模型是查找匹配目标,识别算法根据特征值进行反复多层的匹配来确定结果。
   语音和语言模型要进行精心的组织,组织完要进行训练,训练后要用测试样本确定识别成功率,成功率低的话还要重新录制和组织,所以说语音和语言模型比较重要。
   识别算法从HMM到DNN等等,也逐渐成熟,性能也满足了要求,识别率方面也能有效提升。
   语音识别ASR开源项目里知名的有CMU Sphinx和kaldi等等,kaldi新,支持的模型更多,比如阿里巴巴的模型,所以功能更好用一些。这2个开源项目锐英源都用过。
产品
kaldi数据准备
小语种语音识别
语音识别标注
语音识别系统
语音识别转文字
开源项目
Audacity
联系方式
固话:0371-63888850

手机:138-0381-0136

Q Q:396806883
微信:ryysoft
头条号:软件技术及人才和养生
语音识别kaldi QQ群:14372360

语音识别ASR开源心得
语音识别ASR开源英语
友情链接
版权所有 Copyright(c)2004-2015 锐英源软件
公司注册号:410105000449586 豫ICP备08007559号 最佳分辨率 1024*768
地址:A、郑州市芯互联大厦北楼1803A(文化路优胜北路西北角),B、郑州大学北校区院内