导航:首页 > 编程语言 > 语音识别对齐python

语音识别对齐python

发布时间:2022-10-23 14:57:57

‘壹’ python怎么将语音识别内容保存为txt文本

将语音识别的内容保存为TXT,这个问题简单,参考方法如下:

第一:打开文字识别软件,选择上面的语音识别功能;

第三:点击开始识别按钮,开始进行语音识别;

第四:等待识别完成之后,点击右下角的保存为TXT。

以上便是解决问题的全部步骤了,希望对问题能提供帮助!

‘贰’ Python语音识别,调用的是哪个客户端接口函数

调用腾讯云的语音识别(一句话识别)接口-Python版。
安装语音识别,语音识别器编码,处理Ubuntu服务器,处理WSL。
要运行我们代码的语音识别库,我们首先需要安装语音识别,然后还必须安装PyAudio。首先,我们从主包开始:sudo pip3 install SpeechRecognition安装应该遵循完全相同的格式,但我似乎缺少了让它正常工作的软件包,试图安装PyAudio会出错。这些软件包应该删除该错误。那时我不需要更新apt,但先更新它并不坏处。sudo apt-get install libasound-dev portaudio19-dev libportaudio2libportaudiocpp0有了它,您应该可以安装PyAudio:sudo pip3 install PyAudio语音识别器编码。
运行WSL(linux版Windows子系统)的Windows机器。它也使用了Ubuntu 16.04,所以安装过程是一样的。不过说到使用麦克风,WSL并不那么简单。为了通过Ubuntu终端应用程序控制麦克风,需要安装PulseAudio。

‘叁’ 有人在用python开发程序时使用到语音识别相关的东西吗

我自己有做过一些小程序有用到过不过比较业余,目前就接触过两种模块
wIndows下如果系统自带语音识别系统可以使用这个模块: https://pypi.python.org/pypi/speech/
mac,Linux,还有系统无语音识别的windows可以使用这个:https://pypi.python.org/pypi/SpeechRecognition/
欢迎交流

‘肆’ Python用什么模块开发语音识别系统

shell是unix 或者linux下的脚本语言,用于linux下 的日常任务管理和开发。perl,python两个都是跨系统的脚本语言,perl在过去多用于文本处理、linux日常任务开发,和CGI程序开发,python基本定位和perl类似,但比perl要好学很多。

‘伍’ 如何用python调用百度语音识别

#!/usr/bin/env python
# -*- coding: utf-8 -*-
########################################################################
#
# Copyright (c) 2017 aibot.me, Inc. All Rights Reserved
#
########################################################################

"""
File: util_voice.py
Author: darrenwang([email protected])
Date: 2017/03/24 11:29:50
Brief:
"""

import sys
import json
import time
import base64
import urllib
import urllib2
import requests

class BaiRest:
def __init__(self, cu_id, api_key, api_secert):
self.token_url = "https://openapi..com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s"
self.getvoice_url = "http://tsn..com/text2audio?tex=%s&lan=zh&cuid=%s&ctp=1&tok=%s"
self.upvoice_url = 'http://vop..com/server_api'

self.cu_id = cu_id
self.get_token(api_key, api_secert)
return

def get_token(self, api_key, api_secert):
token_url = self.token_url % (api_key,api_secert)
r_str = urllib2.urlopen(token_url).read()
token_data = json.loads(r_str)
self.token_str = token_data['access_token']
return True

#语音合成
def text2audio(self, text, filename):
get_url = self.getvoice_url % (urllib2.quote(text), self.cu_id, self.token_str)
voice_data = urllib2.urlopen(get_url).read()
voice_fp = open(filename,'wb+')
voice_fp.write(voice_data)
voice_fp.close()
return True

##语音识别
def audio2text(self, filename):
data = {}
data['format'] = 'wav'
data['rate'] = 8000
data['channel'] = 1
data['cuid'] = self.cu_id
data['token'] = self.token_str

wav_fp = open(filename,'rb')
voice_data = wav_fp.read()
data['len'] = len(voice_data)
#data['speech'] = base64.b64encode(voice_data).decode('utf-8')
data['speech'] = base64.b64encode(voice_data).replace('\n', '')
#post_data = json.mps(data)
result = requests.post(self.upvoice_url, json=data, headers={'Content-Type': 'application/json'})
data_result = result.json()
print data_result
return data_result['result'][0]

def test_voice():
api_key = "SrhYKqzl3SE1URnAEuZ0FKdT"
api_secert = ""
bdr = BaiRest("test_python", api_key, api_secert)

#生成
start = time.time()
bdr.text2audio("你好啊", "out.wav")
using = time.time() - start
print using

#识别
start = time.time()
#result = bdr.audio2text("test.wav")
#result = bdr.audio2text("weather.pcm")
using = time.time() - start
print using, result

return True

if __name__ == "__main__":
test_voice()

‘陆’ 有人在用python开发程序时使用到语音识别相关的东西吗

调用网络语言识别API的

# -*- coding=utf-8 -*-

import base64
import urllib2
import urllib
import json
import wave

def get_token():
URL = 'http://openapi..com/oauth/2.0/token'
_params = urllib.urlencode({'grant_type': 'client_credentials',
'client_id': 'yours',#改成你自己的
'client_secret': 'yours'})#改成你自己的
_res = urllib2.Request(URL, _params)
_response = urllib2.urlopen(_res)
_data = _response.read()
_data = json.loads(_data)
return _data['access_token']


def wav_to_text(wav_file):
try:
wav_file = open(wav_file, 'rb')
except IOError:
print u'文件错误啊,亲'
return
wav_file = wave.open(wav_file)
n_frames = wav_file.getnframes()
frame_rate = wav_file.getframerate()
if n_frames != 1 or frame_rate not in (8000, 16000):
print u'不符合格式'
return
audio = wav_file.readframes(n_frames)
seconds = n_frames/frame_rate+1
minute = seconds/60 + 1
for i in range(0, minute):
sub_audio = audio[i*60*frame_rate:(i+1)*60*frame_rate]
base_data = base64.b64encode(sub_audio)
data = {"format": "wav",
"token": get_token(),
"len": len(sub_audio),
"rate": frame_rate,
"speech": base_data,
"cuid": "B8-AC-6F-2D-7A-94",
"channel": 1}
data = json.mps(data)
res = urllib2.Request('http://vop..com/server_api',
data,
{'content-type': 'application/json'})
response = urllib2.urlopen(res)
res_data = json.loads(response.read())
print res_data['result'][0]

if __name__ == '__main__':
wav_to_text('demo.wav')


‘柒’ 怎么用python实现语音识别

是想语音识别的参考方法如下:

1、打开文字识别软件,关闭提示窗;

2、点击上面的语音识别功能;

以上便是实现语音识别的方法了,希望可以帮助到您,感谢观看!

‘捌’ 利用Python对praat构建的语音数据集如何进行训练

摘要 【python语音识别训练_用 Python 训练自己的语音识别系统,这波操作稳了_weixin_39942037的博客-CSDN博客】https://blog.csdn.net/weixin_39942037/article/details/111446620

‘玖’ Python用什么模块开发语音识别系统

推荐使用YQ5969,这个语音识别模块可以支持1--8个咪头,还可以支持本地和云端识别不同需求。5米内本地识别率 93%以上,云端识别率97%。这个语音识别模块可以滤除噪声。由于我们生活在一个相对的噪音环境里,
在远场识别中,用户和设备有一定距离,很多时候噪声源距离麦克风的位置比人更近,在某种程度中也为录制声音带来了一定的困难。

‘拾’ 如何用python调用百度语音识别

1、首先需要打开网络AI语音系统,开始编写代码,如图所示,编写好回车。

阅读全文

与语音识别对齐python相关的资料

热点内容
文件系统pdf 浏览:762
原神安卓区服什么意思 浏览:34
贝壳app怎么线上发布 浏览:157
如何挑选安卓系统机顶盒 浏览:53
安卓快充使用有什么注意事项 浏览:909
黑马程序员的云计算网课 浏览:946
endnotestyle文件夹怎么导入 浏览:460
讲解少儿编程演讲会开头 浏览:424
思科交换机基础命令 浏览:497
便签可以设置加密吗 浏览:339
免费漫画app怎么看书 浏览:27
华为笔记本电脑怎么安装抖音app 浏览:412
阿里云国际版试用的服务器怎么搞 浏览:895
java正则表达式工具 浏览:160
oa服务器怎么设置ftp 浏览:10
安卓如何安装obb 浏览:442
QQ聊天记录journal文件夹 浏览:118
苹果公司云服务器地址 浏览:85
加密记事本手机 浏览:437
汽车压缩机变频阀 浏览:95