我熬了一晚上,做了一个永久免费的语音输入工具

昨天晚上,我实在受不了了。

现在市面上的语音输入工具,不是要登录,就是要会员;不是限制次数,就是限制时长。

有的刚开始说免费,用着用着就开始弹窗收费。

最难受的是,你明明只是想把自己说的话变成文字,结果还要被各种第三方服务卡着。

所以我干脆熬了一晚上,自己做了一个。

名字很简单,就叫 VoiceInput

这是一个 macOS 上的语音输入工具。

你把光标放到任何输入框里,按一下快捷键开始说话,再按一下结束,它就会自动把你说的话识别成文字,然后粘贴到当前窗口里。

目前默认快捷键是:

Option + K

整个流程很简单:

  1. 光标放到要输入的位置
  2. Option + K 开始录音
  3. 说完后再按一次 Option + K
  4. 自动识别成文字
  5. 自动复制到剪贴板,并尝试粘贴到当前输入框

它不是一个只能演示的 Demo。

目前完整链路已经跑通了:

  • 菜单栏常驻
  • 全局快捷键启动录音
  • 麦克风采集音频
  • 实时语音识别
  • 底部悬浮面板显示状态
  • 识别结果写入剪贴板
  • 有权限时自动粘贴到当前应用
  • 没有自动粘贴权限,也可以手动 Cmd + V

也就是说,你可以在微信、飞书、浏览器、编辑器、文档里直接用它。

你说话,它打字。

这就是我最想要的东西。

为什么我要自己做一个?

原因很简单:我不想再被第三方限制了。

语音输入本来就应该是一个基础能力。

你每天写消息、写文档、写文章、记灵感,很多时候不是不会写,而是懒得敲键盘。

尤其是长文本,打字真的太慢了。

但很多语音输入工具,把这件事搞复杂了:

  • 要注册账号
  • 要开会员
  • 要限制使用次数
  • 要绑定某个平台
  • 要接受一堆你不想要的功能

我只是想说一句话,然后让它变成文字。

就这么简单。

所以我决定自己做。

这个工具有什么特点?

第一,它是菜单栏工具。

启动后不会占 Dock,不会打扰你,就安静地待在菜单栏里。你要用的时候按快捷键,不用的时候它就在那里。

第二,它是全局可用的。

不是只能在某个软件里用,而是你把光标放到哪里,它就可以把文字输入到哪里。

第三,它有实时反馈。

录音的时候,底部会出现悬浮面板,告诉你现在是在录音、识别中,还是已经识别完成。

第四,它能自动粘贴。

识别完成后,文本会先写入剪贴板。如果你授权了辅助功能权限,它会自动帮你粘贴到当前输入框。

如果没有授权,也没关系,结果还在剪贴板里,你手动 Cmd + V 就行。

第五,它是开源的。

这点很重要。

我不想做一个黑盒工具,也不想让大家担心它偷偷干什么。

代码大家都可以看,可以改,可以自己编译,也可以按自己的需求二次开发。

它永久免费

这个工具,我会保持 永久免费

不是“限时免费”。

不是“基础版免费,高级版收费”。

不是“先免费积累用户,后面再收割”。

就是永久免费。

而且它是开源的,大家都可以拿去用。

你可以自己用,也可以推荐给朋友用;你可以研究它的代码,也可以基于它改一个适合自己的版本。

我做这个东西的初衷很简单:

让语音输入这件事,重新变得简单一点。

不用被第三方平台限制。

不用担心哪天又开始收费。

不用为了一个基础功能,被迫接受一堆乱七八糟的东西。

目前版本已经能日常使用

当然,我也说实话。

它现在还是一个 MVP 版本,不是商业级完美产品。

目前已经可用的功能包括:

  • macOS 菜单栏运行
  • Option + K 开始 / 结束录音
  • 豆包 ASR 语音识别
  • 实时显示识别状态
  • 自动写入剪贴板
  • 自动粘贴到当前窗口
  • 图形化配置语音识别参数
  • 诊断日志,方便排查问题

目前还在优化的地方包括:

  • 自定义快捷键
  • 更完善的权限引导
  • 识别失败后的自动重试
  • 文本清洗
  • 更好的 UI 动画
  • 更安全的本地配置存储

但核心链路已经跑通了。

也就是说,它已经可以完成最重要的事情:

你说话,它输入。

谁适合用?

如果你经常写文章,可以用它快速输出初稿。

如果你经常写文档,可以用它把想法先说出来。

如果你经常回消息,可以用它少敲很多字。

如果你是程序员,也可以用它写注释、写需求、写日报。

如果你只是想找一个干净、简单、不乱收费的语音输入工具,也可以试试它。

它不想做大而全。

它只想把一件事做好:

把语音变成文字,然后输入到你正在使用的地方。

最后

我熬了一晚上做这个工具,不是因为我觉得它有多复杂。

恰恰相反,是因为我觉得这件事本来不应该这么复杂。

语音输入应该像复制粘贴一样自然。

想用就用。

不用登录一堆账号。

不用被次数限制。

不用担心哪天突然收费。

所以我把它做出来了,也把它开源出来。

VoiceInput,永久免费,开源可用。

大家都可以拿去用。

如果你也受够了各种第三方语音输入工具的限制,可以试试这个。

以后,能用自己的,就别再被别人卡着了。


我是程序员晚枫,全网30万+粉丝,python-office开源作者,专注分享AI工具和自动化办公实战。

我的个人网站:https://www.python4office.cn,欢迎访问。