Skip to content

rechawine/specAugment_tool

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 

Repository files navigation

specAugment_tool

Data Augmentation Methods for Speech

针对低资源的语音合成TTS任务

较为常用的三种数据增强方法:时间扭曲(Time Warping) 频率掩蔽(Frequency Mask) 时间掩蔽(Time Mask)

  1. 时间扭曲(Time Warping):在时间轴上随机扭曲频谱图。与速度扰动不同,这种方法不会增加或减少持续时间,而是在局部压缩和拉伸频谱图。
  2. 频率掩蔽(Frequency Mask):频谱图的 连续频率bin被随机掩蔽
  3. 时间掩蔽(Time Mask):频谱图的 连续时间帧被掩蔽

同时修改了time_wrap函数中部分维度错误的代码部分

About

Data Augmentation Methods for Speech

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages