
Audio Note
Audio Note是一个实时语音转录软件,利用开源的Whisper模型,将音频或视频文件、麦克风音频以及应用程序的音频实时转录为文本。它支持多种语言和文件格式(如 MP3、WAV、FLAC 等),并提供字幕导出功能(支持 SRT、VTT 等格式)。此外,Audio Note 的转录过程完全在本地设备上完成,确保数据安全,非常适合处理敏感音频内容
Riffusion 是一个免费开源的具有稳定扩散的实时音乐和音频生成库,用户只需输入音乐描述,AI便可以生成对应风格的音乐。该开源项目由Seth Forsgren 和 Hayk Martiros推出,Riffusion的背后原理是基于Stable Diffusion(文本生成图像模型)微调频谱图,频谱图是音频的视觉表示,显示不同频率随时间的振幅,而后再将高保真度的频谱图图像转换为音频。