導航:首頁 > 編程語言 > 語音識別對齊python

語音識別對齊python

發布時間:2022-10-23 14:57:57

『壹』 python怎麼將語音識別內容保存為txt文本

將語音識別的內容保存為TXT,這個問題簡單,參考方法如下:

第一:打開文字識別軟體,選擇上面的語音識別功能;

第三:點擊開始識別按鈕,開始進行語音識別;

第四:等待識別完成之後,點擊右下角的保存為TXT。

以上便是解決問題的全部步驟了,希望對問題能提供幫助!

『貳』 Python語音識別,調用的是哪個客戶端介面函數

調用騰訊雲的語音識別(一句話識別)介面-Python版。
安裝語音識別,語音識別器編碼,處理Ubuntu伺服器,處理WSL。
要運行我們代碼的語音識別庫,我們首先需要安裝語音識別,然後還必須安裝PyAudio。首先,我們從主包開始:sudo pip3 install SpeechRecognition安裝應該遵循完全相同的格式,但我似乎缺少了讓它正常工作的軟體包,試圖安裝PyAudio會出錯。這些軟體包應該刪除該錯誤。那時我不需要更新apt,但先更新它並不壞處。sudo apt-get install libasound-dev portaudio19-dev libportaudio2libportaudiocpp0有了它,您應該可以安裝PyAudio:sudo pip3 install PyAudio語音識別器編碼。
運行WSL(linux版Windows子系統)的Windows機器。它也使用了Ubuntu 16.04,所以安裝過程是一樣的。不過說到使用麥克風,WSL並不那麼簡單。為了通過Ubuntu終端應用程序控制麥克風,需要安裝PulseAudio。

『叄』 有人在用python開發程序時使用到語音識別相關的東西嗎

我自己有做過一些小程序有用到過不過比較業余,目前就接觸過兩種模塊
wIndows下如果系統自帶語音識別系統可以使用這個模塊: https://pypi.python.org/pypi/speech/
mac,Linux,還有系統無語音識別的windows可以使用這個:https://pypi.python.org/pypi/SpeechRecognition/
歡迎交流

『肆』 Python用什麼模塊開發語音識別系統

shell是unix 或者linux下的腳本語言,用於linux下 的日常任務管理和開發。perl,python兩個都是跨系統的腳本語言,perl在過去多用於文本處理、linux日常任務開發,和CGI程序開發,python基本定位和perl類似,但比perl要好學很多。

『伍』 如何用python調用百度語音識別

#!/usr/bin/env python
# -*- coding: utf-8 -*-
########################################################################
#
# Copyright (c) 2017 aibot.me, Inc. All Rights Reserved
#
########################################################################

"""
File: util_voice.py
Author: darrenwang([email protected])
Date: 2017/03/24 11:29:50
Brief:
"""

import sys
import json
import time
import base64
import urllib
import urllib2
import requests

class BaiRest:
def __init__(self, cu_id, api_key, api_secert):
self.token_url = "https://openapi..com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s"
self.getvoice_url = "http://tsn..com/text2audio?tex=%s&lan=zh&cuid=%s&ctp=1&tok=%s"
self.upvoice_url = 'http://vop..com/server_api'

self.cu_id = cu_id
self.get_token(api_key, api_secert)
return

def get_token(self, api_key, api_secert):
token_url = self.token_url % (api_key,api_secert)
r_str = urllib2.urlopen(token_url).read()
token_data = json.loads(r_str)
self.token_str = token_data['access_token']
return True

#語音合成
def text2audio(self, text, filename):
get_url = self.getvoice_url % (urllib2.quote(text), self.cu_id, self.token_str)
voice_data = urllib2.urlopen(get_url).read()
voice_fp = open(filename,'wb+')
voice_fp.write(voice_data)
voice_fp.close()
return True

##語音識別
def audio2text(self, filename):
data = {}
data['format'] = 'wav'
data['rate'] = 8000
data['channel'] = 1
data['cuid'] = self.cu_id
data['token'] = self.token_str

wav_fp = open(filename,'rb')
voice_data = wav_fp.read()
data['len'] = len(voice_data)
#data['speech'] = base64.b64encode(voice_data).decode('utf-8')
data['speech'] = base64.b64encode(voice_data).replace('\n', '')
#post_data = json.mps(data)
result = requests.post(self.upvoice_url, json=data, headers={'Content-Type': 'application/json'})
data_result = result.json()
print data_result
return data_result['result'][0]

def test_voice():
api_key = "SrhYKqzl3SE1URnAEuZ0FKdT"
api_secert = ""
bdr = BaiRest("test_python", api_key, api_secert)

#生成
start = time.time()
bdr.text2audio("你好啊", "out.wav")
using = time.time() - start
print using

#識別
start = time.time()
#result = bdr.audio2text("test.wav")
#result = bdr.audio2text("weather.pcm")
using = time.time() - start
print using, result

return True

if __name__ == "__main__":
test_voice()

『陸』 有人在用python開發程序時使用到語音識別相關的東西嗎

調用網路語言識別API的

# -*- coding=utf-8 -*-

import base64
import urllib2
import urllib
import json
import wave

def get_token():
URL = 'http://openapi..com/oauth/2.0/token'
_params = urllib.urlencode({'grant_type': 'client_credentials',
'client_id': 'yours',#改成你自己的
'client_secret': 'yours'})#改成你自己的
_res = urllib2.Request(URL, _params)
_response = urllib2.urlopen(_res)
_data = _response.read()
_data = json.loads(_data)
return _data['access_token']


def wav_to_text(wav_file):
try:
wav_file = open(wav_file, 'rb')
except IOError:
print u'文件錯誤啊,親'
return
wav_file = wave.open(wav_file)
n_frames = wav_file.getnframes()
frame_rate = wav_file.getframerate()
if n_frames != 1 or frame_rate not in (8000, 16000):
print u'不符合格式'
return
audio = wav_file.readframes(n_frames)
seconds = n_frames/frame_rate+1
minute = seconds/60 + 1
for i in range(0, minute):
sub_audio = audio[i*60*frame_rate:(i+1)*60*frame_rate]
base_data = base64.b64encode(sub_audio)
data = {"format": "wav",
"token": get_token(),
"len": len(sub_audio),
"rate": frame_rate,
"speech": base_data,
"cuid": "B8-AC-6F-2D-7A-94",
"channel": 1}
data = json.mps(data)
res = urllib2.Request('http://vop..com/server_api',
data,
{'content-type': 'application/json'})
response = urllib2.urlopen(res)
res_data = json.loads(response.read())
print res_data['result'][0]

if __name__ == '__main__':
wav_to_text('demo.wav')


『柒』 怎麼用python實現語音識別

是想語音識別的參考方法如下:

1、打開文字識別軟體,關閉提示窗;

2、點擊上面的語音識別功能;

以上便是實現語音識別的方法了,希望可以幫助到您,感謝觀看!

『捌』 利用Python對praat構建的語音數據集如何進行訓練

摘要 【python語音識別訓練_用 Python 訓練自己的語音識別系統,這波操作穩了_weixin_39942037的博客-CSDN博客】https://blog.csdn.net/weixin_39942037/article/details/111446620

『玖』 Python用什麼模塊開發語音識別系統

推薦使用YQ5969,這個語音識別模塊可以支持1--8個咪頭,還可以支持本地和雲端識別不同需求。5米內本地識別率 93%以上,雲端識別率97%。這個語音識別模塊可以濾除雜訊。由於我們生活在一個相對的噪音環境里,
在遠場識別中,用戶和設備有一定距離,很多時候雜訊源距離麥克風的位置比人更近,在某種程度中也為錄制聲音帶來了一定的困難。

『拾』 如何用python調用百度語音識別

1、首先需要打開網路AI語音系統,開始編寫代碼,如圖所示,編寫好回車。

閱讀全文

與語音識別對齊python相關的資料

熱點內容
華為筆記本電腦怎麼安裝抖音app 瀏覽:410
阿里雲國際版試用的伺服器怎麼搞 瀏覽:895
java正則表達式工具 瀏覽:158
oa伺服器怎麼設置ftp 瀏覽:8
安卓如何安裝obb 瀏覽:440
QQ聊天記錄journal文件夾 瀏覽:118
蘋果公司雲伺服器地址 瀏覽:85
加密記事本手機 瀏覽:437
汽車壓縮機變頻閥 瀏覽:95
域外伺服器是什麼意思 瀏覽:639
大眾點評伺服器怎麼老卡頓 瀏覽:556
javavector與list的區別 瀏覽:316
java初始化類數組 瀏覽:303
java字元串轉換成json對象 瀏覽:648
android非阻塞socket 瀏覽:358
編譯系統概念 瀏覽:452
天眼通app能做什麼 瀏覽:557
魅族手機怎麼加密圖庫 瀏覽:8
rpa編譯器 瀏覽:572
車載雲伺服器記錄 瀏覽:740