Kaldi Gstream环境准备和模型准备

Pip安装不上

deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial main restricted
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates main restricted
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial universe
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates universe
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial multiverse
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates multiverse
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security main restricted
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security universe
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security multiverse

pip command not found

sudo apt-get install python-pip

如何解决apt-get中Unmet dependencies问题

https://blog.csdn.net/duanlove/article/details/54666441?utm_source=blogxgwz0

apt-get install build-essential

apt-get install zlib1g-dev libc6-dev libc-dev libmysqlclient-dev

虚拟机里重新安装u18

兼容workstation 6.5-7

用vm15.5版本安装没上面问题。

sudo apt-get install libatlas-dev，这个说源里没有

这次tool下的mkl脚本能正常安装，奇怪，上个虚拟机就不行。
configure failed: Could not find file /include/fst/fst.h:
you may not have installed OpenFst. See ../tools/INSTALL ***

tools/make没执行

Warning: IRSTLM is not installed by default anymore. If you need IRSTLM
Warning: use the script extras/install_irstlm.sh
All done OK.

#下载训练好的nnet2模型
cd demo
chmod +x prepare-models.sh
./prepare-models.sh

Demo目录在gst-kaldi-nnet2-online目录下

下载模型很费时间

Gstream主目录找不到

使用kaldi+gstream时，这个图片的目录是从哪里下载来的？
git clone https://github.com/alumae/kaldi-gstreamer-server

https://gitee.com/Happay-Code/kaldi-gstreamer-server.git

gst调用onlinennet2的so应该是通过export GST_PLUGIN_PATH，但模型的位置在哪里？
python kaldigstserver/worker.py -u ws://localhost:8888/worker/ws/speech -c sample_english_nnet2.yaml
启动work就相当于启动服务器

自己的训练模型结果怎么和gstream对接

Demo目录在gst-kaldi-nnet2-online目录下，下面的models里有模型，但这是不是只对应demo下的可执行文件？

应用模型方法

建个目录，把训练结果放models目录下，在脚本里参数指定是带models
用到了解码图HCLG.fst，以及声学模型final.mdl。words.txt用于将数字映射为对应的单词，内容大致如下：
<eps> 0
!SIL 1
<SPOKEN_NOISE> 2
<UNK> 3
A 4
A''S 5
A'BODY 6
A'COURT 7
...
spk2utt用于将语音和说话人对应起来
utt1 utt1
utt2 utt2
...
wav.scp用于指定待解码语音所在路径
utt1 testwav/1.wav

ivector_extractor

gmm模型需要的目录
final.dubm
MFCC语音特征提取同样的道理，它的13个系数（也许还有13个一阶差分和13个二阶差分）都是通过离散余弦变换（DCT）而来，并取前13个系数。

通信问题

Object 包含非基元或非直接复制到本机结构中的数据。
Object contains non-primitive or non-blittable data. (Parameter 'value')
用FileUpload例子，内部代码会出错，

尝试读取或写入受保护的内存。这通常指示其他内存已损坏。”

示例运行

主，Work，执行client.时出错
Error message: No decoder available, try again later
网页线索：内存扩大到4G，没提示。但我的就是4G了。
python kaldigstserver/worker.py -u ws://localhost:8088/worker/ws/speech -c sample_english_nnet2.yaml
terminate called after throwing an instance of 'kaldi::KaldiFatalError'
what(): kaldi::KaldiFatalError
Aborted (core dumped)

Cannot open config file: test/models/english/tedlium_nnet_ms_sp_online/conf/mfcc.conf

没下载测试用的模型数据，安装curl后可以下载

Server负责接受client发过来的音频，并且将音频转给worker来进行语音识别，结果再返回给client。有时候我们没有办法配置出server和client，那么可以使用官方项目中提供的远程server和worker来使用。

友情链接