Skip to content

非官方的科大讯飞语音合成(用于朗读,配音场景)python API (基于官方demo增加了:超过2000字上限自动分割再合并音频的功能)

Notifications You must be signed in to change notification settings

ALLinLLM/iflytek_tts_python

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

科大讯飞语音合成 python API

本项目基于官方的语音合成demo(python3)

提供了以下功能:

  • 长文本(>=2000字)自动拼接
  • 参数全部配置文件化,不用改一行代码,方便使用
  • 断句换气时间可配置,默认1秒

官方的语音合成web API有一个坑,就是不能转超过2000字的文字,在朗读场景和短视频配音场景使用非常不便,

针对这个痛点,我根据每天的免费调用量有500次,制作了一个多次调用,然后合并mp3音频的demo,极大地方便了使用,

此外,没有换气的配音太像机器人,所以我增加了断句换气的参数,默认1秒,根据需要调整

欢迎大家下载使用并提出您宝贵的意见

使用说明:

  1. pip install -r requirements.txt
  2. 把你的科大讯飞web API控制台-语音合成应用APPID, APIKey, APISecret填入config.yaml
  3. 把要转换的文本文件放到inputs文件夹中,修改config.yaml文件中的text_path为你的文本文件路径
  4. 执行语音合成脚本,调用web API

win:

./run.bat

linux:

./run.sh
  1. 输出在outputs文件夹下

About

非官方的科大讯飞语音合成(用于朗读,配音场景)python API (基于官方demo增加了:超过2000字上限自动分割再合并音频的功能)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages