直接在任何浏览器或桌面应用中,向 ChatGPT 输入框口述 500 字的提示词。 StarWhisper 是适用于 Windows 的本地优先语音转文本快捷键,可用于 ChatGPT、Claude、Gemini、Perplexity、Cursor 和任何文本框。
从安装到在五分钟内直接口述到 ChatGPT。
下载 StarWhisper 从 starwhisper.ai 或 Microsoft Store. 安装大约需要一分钟。首次启动时,请允许麦克风访问。免费计划每天覆盖 500 字,足以完成多个长提示词。
在 Chrome、Edge、Firefox、Brave 或任何浏览器中访问 chatgpt.com。或者打开官方的 ChatGPT Windows 桌面应用。两种方式的口述流程是相同的。开始新对话或继续现有对话。
将光标放置在对话底部的消息文本输入框内。这是标记为“Ask anything”或类似的区域。StarWhisper 会输入到当前有焦点的任何 Windows 文本控件中,因此在开始之前,光标必须位于正确的位置。
按下并按住全局口述快捷键。默认设置适用于大多数配置,如果您更喜欢其他快捷键,可以在“设置”中重新绑定。StarWhisper 图标会显示录音状态,让您知道开始说话前麦克风是否已激活。
以您自然说话的速度口述整个提示词。包括长指令、背景信息、示例、限制条件、所需的输出格式,所有内容。在句子结束处停顿。Whisper 会自动处理标点符号。您可以使用任何 96 种支持的语言.
当您释放快捷键时,StarWhisper 会进行本地转录,并将结果粘贴到 ChatGPT 输入框中。阅读它,修正 Whisper 听错的任何词语,如果需要,添加澄清说明,然后点击发送。只有当您按下发送时,您的提示词才会发送给 OpenAI,就像您手动输入的一样。
为撰写长篇、结构化提示词的用户提供的特定优势。
提示词以文本形式出现在输入框中,您可以阅读、重组、添加项目符号、粘贴代码并完善后再发送。语音模式在您说完后就会提交。
ChatGPT、Claude、Gemini、Perplexity、Mistral、You.com、Poe、OpenRouter chat、任何基于浏览器的 AI 都会接收到相同的口述文本。Cursor、VS Code、JetBrains、Slack、Discord、Notion、Word、Gmail 也是如此。
按住快捷键,按照自己的节奏口述,完成后释放。包含示例和指令的多段落提示词会完整地到达。无需停留在语音模式的对话窗口,也不必担心 ChatGPT 会打断您。
音频在您的 PC 上使用本地运行的 Whisper 进行处理。您的语音在到达 ChatGPT 之前不会上传到任何第三方转录服务。只有当您决定按下发送时,文本才会发送给 OpenAI。
免费计划每天 500 字足以完成一天中的多个长提示词。Pro 定价为每月 $10 或每年 $80,可无限量口述,覆盖您日常所有的写作,而不仅仅是 ChatGPT。
用您的母语口述提示词,并要求 ChatGPT 以您偏好的任何语言进行回复。这对于内容创作者、翻译人员以及思维在某一语言上比其他语言更快的任何人都有用。
您使用 ChatGPT 的时间越长,您的提示词就越长。普通用户会写“总结这篇文章”。而高级用户会写一份包含角色分配、背景信息、好坏输出示例、限制条件、目标格式和需要处理的边缘案例列表的多段落简介。这个提示词有 300 到 800 字。手动输入需要五到十五分钟。口述只需要一到三分钟。
速度的差距比听起来更重要。提示词质量是 ChatGPT 输出质量最大的变量。当输入长提示词感觉很慢时,您会偷工减料,遗漏背景信息,跳过本可以引导回复的示例。而口述很快,您会包含所有内容。模型获得了更好的简介,输出也更好,来回沟通也更短。 StarWhisper 旨在让这个循环过程快速化。
口述对于重复工作也更不费力。任何全天使用 ChatGPT 的人,内容营销人员、文案撰稿人、开发人员、创始人、支持工程师、自动化工作流的运维人员都知道,手动输入提示词累积的腕部负荷是相当大的。切换到语音输入可以大致将这种负荷减半。
OpenAI 为 ChatGPT 提供了自己的语音模式。它是一款适用于不同使用场景的优秀产品。两者都值得进行清晰的比较。
| 功能 | ChatGPT 语音模式 | StarWhisper 口述到 ChatGPT |
|---|---|---|
| 最适合 | 对话式的来回交流 | 长篇结构化提示词,发送前可编辑 |
| 获得的输出 | 语音或文本回复,在语音会话中 | 可在提示框中精修的文本 |
| 兼容 Claude/Gemini/Perplexity | 否 | 是,流程相同 |
| 适用于 Cursor、VS Code、Word、Notion | 否 | 是,适用于任何文本框 |
| 音频处理 | 流式传输到 OpenAI | 默认在本地模式下本地处理 |
| 订阅 | 需要 ChatGPT Plus 或 Team | 免费计划覆盖每日口述,Pro 定价 $10/月 |
| 语言 | 支持集较小 | 通过 Whisper 支持 96 种语言 |
当您想像和人聊天一样与 ChatGPT 交流时,语音模式很棒。当您想撰写一份仔细、详细的简介、对其进行编辑,然后才发送时,将内容口述到提示框更佳。
口述一篇 1,500 字文章的简介。口述角度、目标受众、三个子主题、行动号召和品牌语调说明。编辑口述的简介,发送给 ChatGPT,获取初稿。重复此过程以生成大纲和重写内容。了解更多信息,请参阅 内容创作者的语音转文本.
用纯英文口述重构的描述,粘贴现有代码,要求 ChatGPT 或 Claude 进行修改。或者口述测试用例作为自然语言描述。在 Cursor 和 VS Code 中都能完美运行,两者都只是 StarWhisper 的文本输入框。
口述一个包含所有相关背景信息、来源和限制条件的超长问题,这些信息原本您需要总结。由于模型一开始就获得了完整的简介,因此能得到更扎实的答案。
在散步或通勤途中口述战略提示词(Windows 上需佩戴耳机麦克风)。回到工位后进行编辑。然后发送。2026 年,很多战略工作就是这样完成的。
StarWhisper Local Mode 在您自己的 CPU 或 GPU 上运行 Whisper。音频通过您的麦克风捕获,在您的设备内存中处理,并转换为文本,全程无需网络调用。转录过程中不会将任何内容上传到任何地方。StarWhisper 传输到 ChatGPT 输入框中的文本,与您手动输入的文本是完全一致的。
当您在 ChatGPT 中按下发送时,您的文本提示会到达 OpenAI 的服务器,这与手动输入没有任何区别。如果您的顾虑是 OpenAI 能看到提示内容,那么语音输入也不会改变这一点。如果您的顾虑是第三方转录服务接收到您的原始音频,那么 Local Mode 可以彻底解决这个问题。
有一个可选的 Cloud Mode 用于您需要处理困难音频并追求最高准确度的场景。它使用 OpenAI Whisper API。它绝不会意外启用,选择在 StarWhisper UI 中清晰可见,如果您偏好,您可以永久停留在 Local Mode。
经过几次使用后,工作流程会变得自然,速度提升幅度足够大,大多数用户不会再回到纯键盘输入提示的方式。
StarWhisper 是 Windows 的系统级快捷键。语音输入的目标区域是“当前有焦点的任何文本字段”。这意味着您为 ChatGPT 使用的流程,同样适用于:
一次安装,一个快捷键,操作系统上的所有文本输入都支持语音转文本。这就是普通 ChatGPT 用户在几天后采用它,而不仅仅是用于 ChatGPT 的实际原因。