python django如何通过百度api进行文本转语音?

最近在学习python,做一些python练习题github上几年前的练习题有一题是这样的:使用 Python 实现:对着电脑吼一声,自动打开浏览器中的默认网站。例如,对着笔记本电脑吼一声“百度”,浏览器自动打开百度首页。然后开始search相应的功能需要的模块(windows10),理一下思路:本地录音上传录音,获得返回结果组一个map,根据结果打开相应的网页所需模块:PyAudio:录音接口wave:打开录音文件并设置音频参数requests:GET/POST为什么要用百度语音识别api呢?因为免费试用。。不多说,登录百度云,创建应用查看文档REST API文档文档写的蛮详细的,简单概括就是可以下载使用SDK不需要下载使用SDK选择2.根据文档组装url获取token处理本地音频以JSON格式POST到百度语音识别服务器,获得返回结果语音格式格式支持:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。推荐pcm 采样率 :16000 固定值。 编码:16bit 位深的单声道。百度服务端会将非pcm格式,转为pcm格式,因此使用wav、amr会有额外的转换耗时。保存为pcm格式可以识别,只是windows自带播放器识别不了pcm格式的,所以改用wav格式,毕竟用的模块是wave?首先是本地录音import wavefrom pyaudio import PyAudio, paInt16framerate = 16000 # 采样率num_samples = 2000 # 采样点channels = 1 # 声道sampwidth = 2 # 采样宽度2bytesFILEPATH = 'speech.wav'def save_wave_file(filepath, data):wf = wave.open(filepath, 'wb')wf.setnchannels(channels)wf.setsampwidth(sampwidth)wf.setframerate(framerate)wf.writeframes(b&#

我要回帖

更多关于 django api 的文章

 

随机推荐