锐英源软件
第一信赖

精通

英语

开源

擅长

开发

培训

胸怀四海 

第一信赖

当前位置:锐英源 / 开源技术 / 语音识别开源 / Kaldi Gstream环境准备和模型准备

服务方向

人工智能数据处理
人工智能培训
kaldi数据准备
小语种语音识别
语音识别标注
语音识别系统
语音识别转文字
kaldi开发技术服务
软件开发
运动控制卡上位机
机械加工软件
软件开发培训
Java 安卓移动开发
VC++
C#软件
汇编和破解
驱动开发

联系方式

固话:0371-63888850
手机:138-0381-0136
Q Q:396806883
微信:ryysoft

Kaldi Gstream环境准备和模型准备


Pip安装不上

 

deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial main restricted
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates main restricted
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial universe
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates universe
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial multiverse
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates multiverse
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security main restricted
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security universe
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security multiverse

pip command not found

sudo apt-get install python-pip

如何解决apt-get中Unmet dependencies问题

https://blog.csdn.net/duanlove/article/details/54666441?utm_source=blogxgwz0

apt-get install build-essential

apt-get install zlib1g-dev libc6-dev libc-dev libmysqlclient-dev

 

虚拟机里重新安装u18

兼容workstation 6.5-7

用vm15.5版本安装没上面问题。

sudo apt-get install libatlas-dev,这个说源里没有

这次tool下的mkl脚本能正常安装,奇怪,上个虚拟机就不行。
configure failed: Could not find file /include/fst/fst.h:
you may not have installed OpenFst. See ../tools/INSTALL ***

tools/make没执行

Warning: IRSTLM is not installed by default anymore. If you need IRSTLM
Warning: use the script extras/install_irstlm.sh
All done OK.

#下载训练好的nnet2模型
cd demo
chmod +x prepare-­models.sh
./prepare-­models.sh

Demo目录在gst-kaldi-nnet2-online目录下

下载模型很费时间

Gstream主目录找不到

  使用kaldi+gstream时,这个图片的目录是从哪里下载来的?
git clone https://github.com/alumae/kaldi-gstreamer-server

https://gitee.com/Happay-Code/kaldi-gstreamer-server.git

gst调用onlinennet2的so应该是通过export GST_PLUGIN_PATH,但模型的位置在哪里?
python kaldigstserver/worker.py -u ws://localhost:8888/worker/ws/speech -c sample_english_nnet2.yaml
启动work就相当于启动服务器

自己的训练模型结果怎么和gstream对接

Demo目录在gst-kaldi-nnet2-online目录下,下面的models里有模型,但这是不是只对应demo下的可执行文件?

应用模型方法

建个目录,把训练结果放models目录下,在脚本里参数指定是带models
用到了解码图HCLG.fst,以及声学模型final.mdl。words.txt用于将数字映射为对应的单词,内容大致如下:
<eps> 0
!SIL 1
<SPOKEN_NOISE> 2
<UNK> 3
A 4
A''S 5
A'BODY 6
A'COURT 7
...
spk2utt用于将语音和说话人对应起来
utt1 utt1
utt2 utt2
...
wav.scp用于指定待解码语音所在路径
utt1 testwav/1.wav

ivector_extractor

gmm模型需要的目录
final.dubm
MFCC语音特征提取同样的道理,它的13个系数(也许还有13个一阶差分和13个二阶差分)都是通过离散余弦变换(DCT)而来,并取前13个系数。

通信问题

Object 包含非基元或非直接复制到本机结构中的数据。
Object contains non-primitive or non-blittable data. (Parameter 'value')
用FileUpload例子,内部代码会出错,



尝试读取或写入受保护的内存。这通常指示其他内存已损坏。”

示例运行

主,Work,执行client.时出错
Error message: No decoder available, try again later
网页线索:内存扩大到4G,没提示。但我的就是4G了。
python kaldigstserver/worker.py  -u ws://localhost:8088/worker/ws/speech -c sample_english_nnet2.yaml
terminate called after throwing an instance of 'kaldi::KaldiFatalError'
what():  kaldi::KaldiFatalError
Aborted (core dumped)

Cannot open config file: test/models/english/tedlium_nnet_ms_sp_online/conf/mfcc.conf

没下载测试用的模型数据,安装curl后可以下载

 

Server负责接受client发过来的音频,并且将音频转给worker来进行语音识别,结果再返回给client。有时候我们没有办法配置出server和client,那么可以使用官方项目中提供的远程server和worker来使用。

友情链接
版权所有 Copyright(c)2004-2021 锐英源软件
公司注册号:410105000449586 豫ICP备08007559号 最佳分辨率 1024*768
地址:郑州大学北校区院(文化路97号院)内