温馨提醒
如果文章内容或图片资源失效,请留言反馈,我们会及时处理,谢谢
本文最后更新于2024年1月16日,已超过 180天没有更新
运行后,只要按下键盘上的 大写锁定键,就会开始录音,当你松开 大写锁定键 时,就会识别你的录音,并将识别结果立刻输入。
特性:
完全离线、低延迟、高准确率、中英混输、自动阿拉伯数字、自动调整中英间隔
热词功能:可以在 hot-en.txt hot-zh.txt hot-rule.txt 中添加三种热词,客户端动态载入
日记功能:默认每次录音识别后,识别结果记录在 年份/月份/日期.md ,录音文件保存在 年份/月份/assets
关键词日记:识别结果若以关键词开头,会被额外记录在 年份/月份/日期-关键词.md,关键词在 keywords.txt 中定义
服务端、客户端分离,可以让一台主机为局域网内的电脑提供识别服务
用文本编辑器打开 core_client.py ,可以编辑服务端地址、快捷键、录音开关……
注意事项:
目前使用的模型是 Paraformer 非流式模型,即录完再转,因此录音时间越长,上屏延迟越大。主流性能的 Windows 笔记本,RTF 大约 0.06,即大约每10s 录音需 0.6s 转录时长。
当用户安装了 FFmpeg 时,会以 mp3 格式保存录音;当用户没有装 FFmpeg 时,会以 wav 格式保存录音
默认的快捷键是 caps lock,你可以打开 core_client.py 进行修改
MacOS 无法监测到 caps lock 按键,可改为 right shift 按键
修改配置
你可以打开 core_server.py ,在开头部分有注释,指导你修改服务端的端口,默认是 6006
你可以打开 core_client.py ,在开头部分有注释,指导你修改客户端的:
连接的地址和端口,默认是 127.0.0.1 和 6006
键盘快捷键
是否要保存录音文件
要移除识别结果末尾的哪些标点,(如果你想把问号也删除掉,可以在这边加上)
GitHub地址:https://github.com/HaujetZhao/CapsWriter-Offline/
评论0+