:559.692KB : :1 :2021-11-19 18:28:52
1.音频降噪功能,可以消除音频中的环境音,杂音,交通工具等声音,效果很好,欢迎自行测试哈!
2.选择音频的时候,必须是16K文件,采样率16000,单声道WAV文件,其他格式可能不行,最后软件通过FFMPEG将pcm转WAV文件可以正常播放
易语言音频处理软件,音频降噪/切分/离线语音识别/离线TTS例子。
音频切分(通过语气停顿进行精准切分)
1.通过BASS,扫描音频中的波形,并实现说话停顿自动切分,方便一些字幕提取软件的开发
2.源码中默认按照最长20秒一段进行切分,你也可以自行更改,为了方便我已经做了备注
离线语音识别(调用第三方SDK实现,支持中英文识别)
简介
1.市面上windows,离线语音识别寥寥无几,易语言调用的SDK更是几乎为0
2.源码中注意事项已经整理成文档,请按照要求进行相应设置
3.离线语音识别采用CPU运算,对显卡没有要求
4.文件必须是16K文件,采样率16000,单声道WAV格式音频
5.每段音频不能超过60秒,刚好可以和上面的切分功能进行开发
6.电脑需要微软常用的Net库
离线语音合成(调用第三方SDK实现)
1.网上很多离线语音合成的,通过系统自带的调用,效果就不说了
2.本源码支持9个发音人离线合成,支持语速、语调、不同心态合成
3.电脑需要安装JAVA,如果有了就不需要装了
02-15离线语音识别修改版以及使用说明
12-07Lib OCX音频处理软件
12-03文件切分合并文件工具,字节集分割合并