精通
英语
和
开源
,
擅长
开发
与
培训
,
胸怀四海
第一信赖
服务方向
联系方式
Pip安装不上
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial main restricted
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates main restricted
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial universe
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates universe
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial multiverse
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates multiverse
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security main restricted
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security universe
deb http://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security multiverse
sudo apt-get install python-pip
https://blog.csdn.net/duanlove/article/details/54666441?utm_source=blogxgwz0
apt-get install build-essential
apt-get install zlib1g-dev libc6-dev libc-dev libmysqlclient-dev
兼容workstation 6.5-7
用vm15.5版本安装没上面问题。
sudo apt-get install libatlas-dev,这个说源里没有
这次tool下的mkl脚本能正常安装,奇怪,上个虚拟机就不行。
configure failed: Could not find file /include/fst/fst.h:
you may not have installed OpenFst. See ../tools/INSTALL ***
tools/make没执行
Warning: IRSTLM is not installed by default anymore. If you need IRSTLM
Warning: use the script extras/install_irstlm.sh
All done OK.
#下载训练好的nnet2模型
cd demo
chmod +x prepare-models.sh
./prepare-models.sh
Demo目录在gst-kaldi-nnet2-online目录下
下载模型很费时间
使用kaldi+gstream时,这个图片的目录是从哪里下载来的?
git clone https://github.com/alumae/kaldi-gstreamer-server
https://gitee.com/Happay-Code/kaldi-gstreamer-server.git
gst调用onlinennet2的so应该是通过export GST_PLUGIN_PATH,但模型的位置在哪里?
python kaldigstserver/worker.py -u ws://localhost:8888/worker/ws/speech -c sample_english_nnet2.yaml
启动work就相当于启动服务器
Demo目录在gst-kaldi-nnet2-online目录下,下面的models里有模型,但这是不是只对应demo下的可执行文件?
建个目录,把训练结果放models目录下,在脚本里参数指定是带models
用到了解码图HCLG.fst,以及声学模型final.mdl。words.txt用于将数字映射为对应的单词,内容大致如下:
<eps> 0
!SIL 1
<SPOKEN_NOISE> 2
<UNK> 3
A 4
A''S 5
A'BODY 6
A'COURT 7
...
spk2utt用于将语音和说话人对应起来
utt1 utt1
utt2 utt2
...
wav.scp用于指定待解码语音所在路径
utt1 testwav/1.wav
gmm模型需要的目录
final.dubm
MFCC语音特征提取同样的道理,它的13个系数(也许还有13个一阶差分和13个二阶差分)都是通过离散余弦变换(DCT)而来,并取前13个系数。
Object 包含非基元或非直接复制到本机结构中的数据。
Object contains non-primitive or non-blittable data. (Parameter 'value')
用FileUpload例子,内部代码会出错,
尝试读取或写入受保护的内存。这通常指示其他内存已损坏。”
主,Work,执行client.时出错
Error message: No decoder available, try again later
网页线索:内存扩大到4G,没提示。但我的就是4G了。
python kaldigstserver/worker.py -u ws://localhost:8088/worker/ws/speech -c sample_english_nnet2.yaml
terminate called after throwing an instance of 'kaldi::KaldiFatalError'
what(): kaldi::KaldiFatalError
Aborted (core dumped)
Cannot open config file: test/models/english/tedlium_nnet_ms_sp_online/conf/mfcc.conf
没下载测试用的模型数据,安装curl后可以下载
Server负责接受client发过来的音频,并且将音频转给worker来进行语音识别,结果再返回给client。有时候我们没有办法配置出server和client,那么可以使用官方项目中提供的远程server和worker来使用。