温馨提醒
如果文章内容或图片资源失效,请留言反馈,我们会及时处理,谢谢
本文最后更新于2024年1月8日,已超过 180天没有更新
基于OpenAI宣布开源的多语言语音识别系统Whisper,市面上应该没有第二个比它更准确的多语言语音识别系统了,我今天发布的这个软件就是基于它进行优化后的FastWhisper项目的GUI版本FasterWhisperGUI,之前论坛已经发布过WhisperDesktop了,所以我简单说一下它们之间的区别,因为WhisperDesktop是基于C++的Whisper项目而非FastWhisper的,所以效果肯定是没有本软件好的,速度也更慢,并且它也不支持额外参数,导致真正使用的时候效果并不好,我就是因为这点弃用WhisperDesktop的,此外,本软件还支持基于Demucs的人声提取(你应该也找不出第二个比它好的人声提取项目了)以及基于whisperX的字幕处理功能。
这是faster-whisper的图形用户界面软件,您可以:
将音频或视频文件转录为srt/txt/smi/vtt/lrc文件
将在线OpenAI-whisper模型转换为ct2格式
提供VAD模型和whisper模型的所有参数
现在,它支持whisperX
支持Demucs模型
支持whisper large-v3模型
GitHub地址:https://github.com/CheshireCC/faster-whisper-GUI
基于谷歌Colab的在线项目:https://github.com/Ayanaminn/N46Whisper
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论0+