FreGrad

2个月前发布 2 00

FreGrad是一款轻量快速的频率感知扩散声码器,旨在生成逼真的音频。其框架包括离散小波变换、频率感知扩张卷积和一系列增强模型生成质量的技巧。在实验中,FreGrad相比基准模型,训练速度提升3.7倍,推理速度提升2.2倍,同时模型大小减少0.6倍(仅178万参数),而不牺牲输出质量。

收录时间:
2025-05-29

FreGrad是一款轻量快速频率感知扩散声码器,旨在生成逼真的音频。其框架包括离散小波变换、频率感知扩张卷积和一系列增强模型生成质量的技巧。在实验中,FreGrad相比基准模型,训练速度提升3.7倍,推理速度提升2.2倍,同时模型大小减少0.6倍(仅178万参数),而不牺牲输出质量。

数据统计

相关导航

没有相关内容!

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...