专为 Windows 10 和 Windows 11 打造的专业语音转文字工具。 AI 驱动的高精度识别,支持离线使用。免费套餐每日 500 字。
很多人知道 Windows 11 有个内置的Windows语音输入(快捷键 Win+H),但真正用起来的人不多。原因也直接:识别中文的效果参差不齐,依赖网络,遇到专业词汇就容易出错,偶尔还会无缘无故停止工作。这是 Microsoft 为了大众用户做的基础功能,不是专业工具。
StarWhisper 是一款基于 OpenAI Whisper 的第三方Windows语音输入工具,彻底解决了上述问题。它的语音识别引擎在 68 万小时多语言数据上训练,普通话识别准确率高达 99%;所有运算在本地完成,断网也能用;通过悬浮窗口设计,在任何 Windows 应用(Word、微信、钉钉、Outlook、浏览器输入框……)上均可直接语音输入,无需手动复制。
对于国内用户,还有一个显著优势:Whisper 模型对普通话的训练数据远比 Microsoft 内置语音识别丰富,加之对中英混合输入(如「我们要用 ChatGPT 优化这个 workflow」)的处理能力出众,覆盖了中国职场和学术环境中最常见的语言使用模式。
无需任何 Windows 系统设置修改,安装后即用,不与内置语音识别冲突。
自定义热键唤起悬浮窗,当前焦点在哪个输入框,文字就输入到哪里。
与 Win+H 不同,StarWhisper 的所有识别在本地完成,没有 Microsoft 遥测,没有数据上传。
配有 NVIDIA 独立显卡的 Windows 设备开启 CUDA 加速,延迟进一步降低,批量处理速度提升 10 倍。
在决定是否需要第三方Windows语音输入工具之前,最好先清楚两者的实际差距在哪里。
| 对比维度 | StarWhisper | Win+H 语音输入 | 讯飞输入法语音 |
|---|---|---|---|
| 普通话识别精度 | 99%(large-v3) | 中等(依赖云端) | 高(需联网) |
| 离线可用 | ✓ 完全离线 | ✗ 需要联网 | ✗ 主要依赖云端 |
| 数据隐私 | 全本地,零上传 | 音频发送微软 | 音频发送讯飞云 |
| 中英混合识别 | 出色 | 有限 | 良好 |
| 文件批量转录 | ✓ | ✗ 仅实时 | ✗ 仅实时 |
| GPU 加速 | NVIDIA CUDA | 无 | 无 |
| 月使用成本 | 免费 / $10 | 免费(功能受限) | 有增值功能收费 |
如果你的需求是偶尔输入一段短文字、内容不涉及隐私、且不介意准确率偶尔有误,Windows 内置语音输入足够用了。免费、内置、无需安装。但如果你是每天都要用语音输入处理大量内容的用户,或者内容涉及患者信息、法律文件、商业机密,内置工具的局限性会迅速成为阻碍。
免费版即可完整对比:下载安装后无需信用卡,每天500字免费额度,与 Win+H 并排用一天,你会自己得出结论。
免费下载 StarWhisper「识别质量的天花板由录音质量决定」——这是使用任何语音输入工具的首要原则。笔记本电脑内置麦克风会拾取键盘声、风扇噪音和环境回声,严重影响识别精度。建议:办公桌固定场景使用 USB 指向性麦克风(预算 100-300 元即可找到不错的产品);需要走动时使用带麦克风的有线耳机或降噪蓝牙耳机。安装后在 Windows 声音设置中将其设为默认录制设备,将输入音量调至 70-80%。
安装完成后,首次启动会提示下载 Whisper 语音模型。推荐选择:日常口述文档用 small 模型(约 500MB,速度快);处理重要录音或专业内容用 large-v3 模型(约 3GB,精度最高,需 Pro 版)。模型下载完成后可完全离线使用,不需要持续联网。如果你的 Windows 设备有 NVIDIA 显卡,在设置中开启 CUDA 加速,处理速度可提升数倍。
StarWhisper 的悬浮窗口可以停靠在屏幕任意位置,始终置于其他窗口之上。在设置中配置你偏好的热键(默认 Ctrl+Space,可自定义)。当你在 Word、微信、钉钉、Outlook 或浏览器中的任意输入框获得焦点后,按下热键,开始说话,说完再按一次停止,文字自动填入。整个操作无需用鼠标点击 StarWhisper 窗口,流程完全不中断当前工作。
从打字切换到口述,前三天通常会有一个「说话感觉怪异」的适应期——这是正常的,因为你在用一种新的方式组织思维。几个有助于快速适应的技巧:(1)先说完整的句子,不要边想边停顿,停顿时 AI 会认为这段话结束了;(2)对着说话,不要对着键盘或屏幕——眼神和姿势会影响口述的流畅度;(3)不要追求完美的第一遍,先把内容说完,然后对文字稿做一轮快速修改,效率仍然远高于打字。
延伸阅读:Microsoft 官方语音输入使用指南 | OpenAI Whisper 介绍 | 语音转文字软件 | 医疗语音输入
不会冲突。两者可以同时安装,互不干扰。StarWhisper 使用自定义热键(默认 Ctrl+Space,可修改),与 Win+H 的快捷键不同。如果你曾经尝试过 Win+H 发现效果不好,StarWhisper 是直接替代,也可以两者并用在不同场景下。
StarWhisper 完全兼容 Windows 10(1903 及以上)和 Windows 11 全部版本。两个系统上的功能和体验完全一致,没有哪个版本「更好用」的说法——核心差异来自于硬件配置(尤其是有无 NVIDIA GPU)而非系统版本。
完全可以。没有 NVIDIA GPU 时,StarWhisper 以纯 CPU 模式运行。small 模型在普通笔记本上处理1分钟音频大约需要1-2分钟,对于日常口述文档(每次几秒到几十秒的短段落)完全流畅。对于批量处理长录音的场景,建议在有 GPU 的台式机或专业工作站上进行。
可以。StarWhisper 通过 Windows 剪贴板注入文字,原理上与「复制粘贴」相同,因此对所有接受文字输入的应用都有效——包括微信 PC 版、钉钉、飞书、企业微信、各类 CRM 系统等。极少数对输入法有特殊限制的应用可能例外,遇到时可手动复制粘贴转录结果。
不会。StarWhisper 默认以完全离线模式运行,不收集任何使用数据,不上传任何音频或文字内容。Whisper 模型是一个静态 AI 模型文件,下载到本地后独立运行,与 OpenAI 的在线服务完全无关。如果你选择开启 OpenAI 云端 API 增强选项(可选功能),那部分音频会发送到 OpenAI,但这需要你主动配置,默认关闭。
把Windows语音输入从「偶尔尝试」升级为「每天依赖」,从下载 StarWhisper 开始。
免费下载 StarWhisper