MacWhisper 是 Jordi Bruin 开发的流行的 Mac 转录应用。StarWhisper 是基于相同 OpenAI Whisper 引擎构建的 Windows 原生等效产品。采用相同的离线优先设计。拥有相同的模型准确性。但操作系统不同。
两个 Whisper 封装,两个操作系统,两个略有不同的工作流程。
StarWhisper 关注的是本地 Whisper 的 Windows 侧,重点在于实时输入到任何文本字段,而不是基于文件的转录。
MacWhisper 拥有多年的 Mac 用户体验优化、批量文件工作流程,以及适合访谈和播客转录的 Pro 级别功能,例如说话人分离(speaker diarization)。
六个明确的原因,当 MacWhisper 不可用时,Windows 用户会选择这里
StarWhisper 不是移植到 Windows 的 Mac 应用。自 v1 版本以来,它一直是 Windows 专属,具备 Windows IME 集成、前台窗口检测和 Microsoft Store 分发。MacWhisper 在 Windows 上没有任何存在。
按下快捷键或说唤醒词,说话,文本就会出现在任何应用程序的活动文本字段中。StarWhisper 是为“输入到 Word”或“输入到 Slack”的工作流程设计的,而不是“拖入 MP3”的工作流程。
两种产品底层都使用 Whisper。当您选择相同的模型大小,准确性是相同的。该模型是开源的,因此任何产品都不会将您锁定在专有的云转录流程中。
StarWhisper 为 NVIDIA RTX 卡提供了 CUDA 11 和 CUDA 12 套件。中型和大型 Whisper 模型在现代 GPU 上可以接近实时运行。支持 Vulkan 作为 AMD 和 Intel 卡的跨供应商回退方案。
每日 500 个词,每周 3,500 个词,无需信用卡。这对于大多数偶尔使用、学生和作家来说已经足够了,他们每天只进行部分听写。当您需求超出时,Pro 价格是固定的 $10/月或 $80/年。
StarWhisper 在本地模式下完全在您的设备上处理音频。Whisper 模型已捆绑在安装程序中,无需上传步骤。云模式仅对使用较慢硬件且希望使用 OpenAI 托管 API 的用户可选。
您可能阅读了关于 MacWhisper 的资料,观看过演示,然后尝试安装,却发现下载链接是 Mac App Store 的链接。MacWhisper 是一个仅限 macOS 的产品。没有 Windows 版本,也没有宣布的计划。最接近的 Windows 等效产品是 StarWhisper,它在本地运行相同的 OpenAI Whisper 引擎,并遵循相同的离线优先设计。
这两个产品并不相同。MacWhisper 主要是一个文件转录工具:您拖入一个音频或视频文件,选择一个模型,它就会生成一份转录稿。Pro 级别增加了说话人分离,这意味着它可以猜测一个说话人何时结束,下一个说话人何时开始,从而生成像 Speaker 1 和 Speaker 2 这样的标签化输出。这是适用于以访谈为主的工作流程、Mac 上的播客后期制作和需要将数小时录音对话转化为文本的学术研究的理想工具。StarWhisper 主要是一个实时听写工具:您按下快捷键,说话,文本就会出现在您当前聚焦的任何应用程序中。这两种任务都很有用。它们是不同的任务,而这两个产品优化了工作流程的不同部分。
如果您的搜索 MacWhisper 的原因是实时听写,StarWhisper 在 Windows 上完美地满足了这一需求。如果您的原因是 Mac 上的批量文件转录,那么 MacWhisper 是您想要的,而且无法绕过其平台要求。本页面重点关注第一种情况。
数据和功能信息截至 2026 年 5 月 17 日,根据 StarWhisper 应用和 MacWhisper 的公开营销页面验证。MacWhisper 的定价偶尔会变化,因此如果您正在评估购买,请查看 goodsnooze.gumroad.com 获取最新数据。
| 功能 | StarWhisper | MacWhisper |
|---|---|---|
| 操作系统 | Windows 10, Windows 11 | 仅限 macOS |
| Windows 支持 | 是,原生支持 | 无 |
| Mac 支持 | 否 | 是,主要平台 |
| 主要工作流程 | 实时听写 | 文件转录 |
| 底层模型 | OpenAI Whisper (本地) | OpenAI Whisper (本地) |
| 音频处理 | 本地,设备端 | 本地,设备端 |
| 离线可用 | 是 | 是 |
| 免费计划 | 每日 500 个词,每周 3,500 个词 | 有限制的免费版本 |
| Pro 定价模式 | $10/月 或 $80/年 (订阅) | 一次性购买(按级别约 $20-$60) |
| 说话人分离 | 否 | 是 (Pro 级别) |
| 批量文件转录 | 有限 | 强大 |
| 输入到任何应用程序的实时听写 | 是 (Windows IME) | 非主要重点 |
| NVIDIA CUDA 加速 | 是 (CUDA 11/12) | Mac 上不适用 |
| Apple Silicon 加速 | Windows 上不适用 | 是 (Metal) |
| 唤醒词激活 | 是 | 基于快捷键 |
| 支持的语言 | 通过 Whisper 支持 96+ 种语言 | 通过 Whisper 支持 96+ 种语言 |
| Microsoft Store 分发 | 是 | 否 |
思考这次对比最实用的角度不是“哪个更好”,而是“您想完成什么任务”。MacWhisper 和 StarWhisper 都封装了 Whisper,但它们优化的是从口述到转录光谱的不同端点。
MacWhisper 打开后会显示一个“在此处拖放文件”的窗口。您拖入一个访谈 MP3、播客 WAV、讲座 MP4 或 Zoom 录音,MacWhisper 会通过 Whisper 模型处理它并生成一份转录稿。Pro 级别增加了说话人分离,这意味着它可以猜测一个说话人何时结束,下一个说话人何时开始,从而生成像 Speaker 1 和 Speaker 2 这样的标签化输出。这是适用于以访谈为主的工作流程、Mac 上的播客后期制作和需要将数小时录音对话转化为文本的学术研究的理想工具。
StarWhisper 可打开一个托盘图标,等待您的快捷键。按下快捷键,开始说话,文本就会出现在您当前聚焦的任何 Windows 应用中。它的体验类似于 Windows 内置的语音输入法,但引擎强大得多。本产品目标的使用场景与 MacWhisper 不同:在 Outlook 中起草邮件,在 Word 中撰写长段落,在 Teams 中回复聊天,在 pull request 上留下评论,或在电话通话中口述笔记。核心需求是:“我宁愿说话也不愿打字,而且我希望文本能立即出现在这个特定的应用中。”
StarWhisper 支持转录预录音文件,但文件转录并非其主要工作流程。如果您的工作内容是 60% 的实时口述和 30% 的文件转录,StarWhisper 可以同时处理。如果比例相反,并且您使用 Mac,那么 MacWhisper 是更好的选择。如果您使用 Windows 并且需要进行大量的文件批量转录,请查看 我们的 Rev 对比 了解云端方案,以及 我们的 Descript 对比 了解编辑器方案。
这是最常被问到的定价问题。MacWhisper 历史上曾在 Gumroad 上以一次性购买的形式销售,并设有分级升级以获取 Pro 功能。StarWhisper 以每月 $10 或每年 $80 的订阅形式销售。这两种模式都没有错,但它们符合不同软件所有权的心智模型。
一次性购买感觉更简洁。您只需支付一次费用,拥有您当前版本的全部权益,持续的成本仅限于您选择升级的部分。对于那些已经拥有固定工作流程、不需要持续接收新功能的用户来说,这一点很有吸引力。缺点是,一次性购买的软件往往要么停止更新(因为没有收入来支持工作),要么当开发人员需要持续收入时,最终转变为订阅制。
StarWhisper 是订阅制,因为其成本结构是持续性的。Whisper 模型改进通过 Whisper.cpp 和更广泛的开源社区发布;GPU 加速包需要跟上 NVIDIA 驱动程序的更新;Windows 兼容性需要在主要的 Windows 更新中进行维护;而且团队需要持续发布修复补丁。每月 $10 的费用,与维持可持续运营的最低成本更接近,而不是最高成本。按年计费计算,平均每月约为 $6.67,这相当于两杯咖啡的费用,可以换来在所有运行 Windows 的设备上无限次的口述功能。
如果订阅模式是决定性因素,那么 StarWhisper 的 免费层级 每天 500 个词的额度,可能让您无限期使用,而无需付费。对于轻度用户来说,通常是足够的。
两款产品都共享最重要的隐私特性:音频绝不会离开设备。Whisper 模型随安装程序捆绑,在您的 CPU 或 GPU 上本地运行,无需任何网络调用即可生成文本。即使您拔掉了网络线、防火墙处于锁定状态、VPN 关闭,或者您的设备处于没有互联网访问的虚拟机内部,您也可以进行口述或转录。其行为是相同的:说话,获得文本,音频不会离开设备。
这对那些 MacWhisper 历史上服务良好的受众群体尤为重要:处理敏感资料的记者、处理机密材料的律师、撰写会议记录的治疗师、口述病历的医生、以及处于 NDA 约束下的安全研究人员。对于这些用户来说,本地化架构不是一个“锦上添花”的功能,而是满足其职业义务的唯一架构。请看 为作家设计的语音转文本, 为律师设计的语音转文本, 以及 为医生设计的语音转文本 了解针对特定角色的功能划分。
StarWhisper 还提供了一个可选的 Cloud Mode(云模式),它使用 OpenAI Whisper API,适用于那些硬件较慢但需要更快转录速度,并且接受云端处理的用户。Cloud Mode 绝不是默认设置,需要明确同意。对于大多数用户来说,Local Mode(本地模式)是正确的选择,也是我们推荐的。
MacWhisper 是一个很棒的产品。Jordi Bruin 开发了最受欢迎的 Mac Whisper 应用之一,它拥有多年的用户体验打磨、强烈的 Mac 原生感觉,以及一个 Pro 层级,增加了像多说话人说话人分离(speaker diarization)这样的真正有用的功能,用于多说话人访谈转录。其 Mac 平台优化的工作流程、文件批量处理能力以及支持的文件格式广度,都是在您的平台匹配时,MacWhisper 具有优势的领域。
如果您使用的是 Mac,并且主要需求是“转录我已有的这些录音”,那么 MacWhisper 是显而易见的选项之一。StarWhisper 并不是想说服 Mac 用户为一款口述应用而更换操作系统。
许多 MacWhisper 用户发现自己需要在 Windows 机器上实现相同的流程:工作分配的 PC、他们更愿意用于生产力的游戏台式机,或需要帮助的家庭成员的电脑。过渡比您想象的要容易,因为底层引擎是相同的。从 主页下载 或 Microsoft Store 安装 StarWhisper,根据您的硬件选择一个模型大小(老笔记本使用 tiny 或 base,现代 CPU 使用 small 或 medium,NVIDIA RTX 用户使用 large),配置一个快捷键或唤醒词,然后开始口述。
肌肉记忆是可迁移的。音频保留在您设备上的保证是可迁移的。Whisper 的准确性也是可迁移的。唯一改变的是周围的 UI,因为您现在处于一个具有不同惯例的操作系统上。对于大多数跨平台用户来说,这种权衡是值得的,因为他们既保留了自己关心的特性(本地 Whisper),又获得了工作所需的平台(Windows)。
如果您需要了解 Windows 口述选项的更广泛背景,请参阅 StarWhisper vs Windows Voice Typing, 内置的 Microsoft 选项,以及 StarWhisper vs Dragon NaturallySpeaking, 传统的企业级口述产品。如果您对 2026 年最热门的云产品感兴趣,请看 StarWhisper vs Wispr Flow.