如何调整合成音频的音量？ #971

AnonymousmousCoder · 2024-04-15T04:08:44Z

可能是训练音频声音就比较小的缘故，有的模型推理出来的声音很小。如何在不写临时文件的情况下，直接修改audio_fragment的音量呢？

TTS.py

for i, batch in enumerate(audio):
            for j, audio_fragment in enumerate(batch):
                max_audio=torch.abs(audio_fragment).max()#简单防止16bit爆音
                if max_audio>1: audio_fragment/=max_audio
                audio_fragment:torch.Tensor = torch.cat([audio_fragment, zero_wav], dim=0)
                audio[i][j] = audio_fragment.cpu().numpy()

The text was updated successfully, but these errors were encountered:

XXXXRT666 · 2024-04-15T08:03:34Z

建议训练前先去响度匹配，这样推理出来的音频响度就会正常

XXXXRT666 · 2024-04-15T08:04:09Z

要是想的话你可以接一个响度匹配，使用librosa

AnonymousmousCoder · 2024-04-15T09:09:19Z

建议训练前先去响度匹配，这样推理出来的音频响度就会正常

训练时有这个功能吗？

XXXXRT666 · 2024-04-15T09:10:21Z

无，Pr里面有一个

ZhangJianBeiJing · 2024-04-16T06:44:32Z

mark

Wei-JL · 2024-05-14T01:00:54Z

Pr

您好，请问能给一下详细链接吗，没在pr中搜索到，或者有其他的方法吗？

XXXXRT666 · 2024-05-14T01:49:01Z

Pr

您好，请问能给一下详细链接吗，没在pr中搜索到，或者有其他的方法吗？

#937

panjie-payne · 2024-07-02T02:53:04Z

自己用ffmpeg写一个就好了呀, filter volume 就可以了

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

如何调整合成音频的音量？ #971

如何调整合成音频的音量？ #971

AnonymousmousCoder commented Apr 15, 2024

XXXXRT666 commented Apr 15, 2024

XXXXRT666 commented Apr 15, 2024

AnonymousmousCoder commented Apr 15, 2024

XXXXRT666 commented Apr 15, 2024

ZhangJianBeiJing commented Apr 16, 2024

Wei-JL commented May 14, 2024

XXXXRT666 commented May 14, 2024

panjie-payne commented Jul 2, 2024

如何调整合成音频的音量？ #971

如何调整合成音频的音量？ #971

Comments

AnonymousmousCoder commented Apr 15, 2024

XXXXRT666 commented Apr 15, 2024

XXXXRT666 commented Apr 15, 2024

AnonymousmousCoder commented Apr 15, 2024

XXXXRT666 commented Apr 15, 2024

ZhangJianBeiJing commented Apr 16, 2024

Wei-JL commented May 14, 2024

XXXXRT666 commented May 14, 2024

panjie-payne commented Jul 2, 2024