首页

手机版

首页游戏库网络软件系统工具应用软件图形图像多媒体类聊天软件安全软件编程开发

当前位置：电脑软件多媒体类音频处理CapsWriter

CapsWriter (离线识别语音输入工具)绿色版v1.0

大小：1GB
语言：简体中文
类别：音频处理
类型：免费软件
授权：国产软件
时间：2023/05/30
官网：https://www.3h3.com
环境：Windows7/Windows10/Windows All

4.2分

相关软件

软件简介相关版本猜你喜欢精品推荐用户评论

CapsWriter一款本地离线语音输入识别工具，通过本软件可帮助用户快速高效的对输入的语音进行识别并导出。在CapsWriter软件中用户只需按下caps键即可进行语音的输入，软件会自动的对内容进行识别，识别结果会以彩色显示。

CapsWriter图片

软件介绍

这是 CapsWriter 简陋的离线版，一个 PC 端的语音输入工具。

运行后，只要按下键盘上的大写锁定键，就会开始录音，当你松开大写锁定键时，就会识别你的录音，并将识别结果立刻输入。

安装方法

安装 Python 后，在 cmd 窗口进入本文件夹，运行 pip install -r requirements.txt 安装依赖

sherpa-onnx-bin 文件夹中已经放置了在 Win10-64 端预先编译的 sherpa-onnx 二进制。

其它系统暂时需要按照 sherpa-onnx — sherpa 1.2 documentation 编译后，放入 sherpa-onnx-bin 文件夹。

使用说明

运行 01sherpa-onnx-server.py 脚本，会载入 Paraformer 模型识别模型（这会占用1GB的内存，载入时长约十几秒）

运行 02-CapsWriter-client.py 脚本，它会打开系统默认麦克风，开始监听按键

按住 CapsLock 键，录音开始，松开 CapsLock 键，录音结束，识别结果立马被输入（录音时长短于0.3秒不算）

注意事项

目前使用的模型是 Paraformer 非实时模型，即录完再转，因此录音时间越长，上屏延迟越大。

主流性能的 Windows 笔记本，RTF 大约 0.06，即大约每 10s 录音需 0.6s 转录时长。

本地模型对算力要求非常低，基本无需担心性能问题

暂不支持标点符号，暂不支持逆标准化（如把中文数字转阿拉伯数字）

为方便用户检查录音质量、识别效果，脚本默认开启了保存录音，所有都被保存在了 audios 文件夹

标签：语音识别

下载地址

PC版/

CapsWriter (离线识别语音输入工具)绿色版v1.0

普通下载通道

精品推荐

网友评论

音频处理周排行/ 音频处理总排行

1 Signum Audio Skye Clipper破解版

7.74MB
详情
2 Studio One 5破解工具

2.36MB
详情
3 Metatogger免安装版

90.48MB
详情
4 Volume Normalizer Master

15.2MB
详情
5 Soundevice Digital FrontDAW(编曲音频插件)

14.5MB
详情
6 九鸿音频

78.6MB
详情
7 FKFX Vocal Freeze(声音冻结效果插件)

48.7MB
详情
8 Snooper声音录制软件

7.99MB
详情

装机必备软件

百度云管家

360安全卫士

百度输入法

软件介绍


猜你喜欢
相关版本
下载地址
精品推荐
返回顶部

回顶部去下载

返回顶部