温馨提醒

如果文章内容或图片资源失效,请留言反馈,我们会及时处理,谢谢

本文最后更新于2024年1月16日,已超过 180天没有更新

运行后,只要按下键盘上的 大写锁定键,就会开始录音,当你松开 大写锁定键 时,就会识别你的录音,并将识别结果立刻输入。

特性:

完全离线、低延迟、高准确率、中英混输、自动阿拉伯数字、自动调整中英间隔

热词功能:可以在 hot-en.txt hot-zh.txt hot-rule.txt 中添加三种热词,客户端动态载入

日记功能:默认每次录音识别后,识别结果记录在 年份/月份/日期.md ,录音文件保存在 年份/月份/assets

关键词日记:识别结果若以关键词开头,会被额外记录在 年份/月份/日期-关键词.md,关键词在 keywords.txt 中定义

服务端、客户端分离,可以让一台主机为局域网内的电脑提供识别服务

用文本编辑器打开 core_client.py ,可以编辑服务端地址、快捷键、录音开关……

注意事项:

目前使用的模型是 Paraformer 非流式模型,即录完再转,因此录音时间越长,上屏延迟越大。主流性能的 Windows 笔记本,RTF 大约 0.06,即大约每10s 录音需 0.6s 转录时长。

当用户安装了 FFmpeg 时,会以 mp3 格式保存录音;当用户没有装 FFmpeg 时,会以 wav 格式保存录音

默认的快捷键是 caps lock,你可以打开 core_client.py 进行修改

MacOS 无法监测到 caps lock 按键,可改为 right shift 按键

修改配置

你可以打开 core_server.py ,在开头部分有注释,指导你修改服务端的端口,默认是 6006

你可以打开 core_client.py ,在开头部分有注释,指导你修改客户端的:

连接的地址和端口,默认是 127.0.0.1 和 6006

键盘快捷键

是否要保存录音文件

要移除识别结果末尾的哪些标点,(如果你想把问号也删除掉,可以在这边加上)

GitHub地址:https://github.com/HaujetZhao/CapsWriter-Offline/

下载地址
百度云盘
密码:eu4c
历史上的今天
01月
16
    抱歉,历史上的今天作者很懒,什么都没写!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。