您的听写内容永远不会离开您的电脑。StarWhisper 完全离线运行 OpenAI Whisper,因此特权或敏感音频永远不会上传到云服务。免费安装,无需帐户。
永久免费。每天 500 字。Pro 版每月 $10,可无限使用。
Dragon 的直接替代品,每月 $10 对比 $500 许可证。
在 Windows 10 和 11 上离线运行。提供 Microsoft Store 安装。无年度合同,无需帐户即可开始使用。
Dragon NaturallySpeaking 几十年来一直主导着语音识别市场,并在当时凭借真正强大的准确度赢得了这一地位。但随着 2022 年 OpenAI 的 Whisper 模型 的发布,格局发生了巨大的变化。Whisper 基于 680,000 小时的多语言音频进行训练,实现了与 Dragon 相当甚至超越 Dragon 的准确度,且无需任何语音训练。如今人们积极寻找 Dragon NaturallySpeaking 替代方案的原因比以往任何时候都更加紧迫:Dragon 的定价高昂(一次性 $200-$500,Pro 版本更高),其 AI 架构与现代神经网络相比已显陈旧,并且用户对语音训练要求和过时的界面感到沮丧。
向 Dragon Medical One 订阅模式的转变也让许多老用户感到疏远。预算用于一次性购买的医疗保健专业人员发现自己面临着经常性的云订阅费用。这促使大量用户寻找能够提供离线操作、现代 AI 准确度和可预测定价的 Dragon NaturallySpeaking 替代方案。StarWhisper 直接满足了这三个要求。
对于评估 Dragon NaturallySpeaking 替代方案的 Windows 听写和转录用户来说,这是一份涵盖所有重要维度的诚实比较。
| 功能 | Dragon NaturallySpeaking | StarWhisper |
|---|---|---|
| 预付费用 | $200-$500+ | $0(免费计划)/ $80/年 Pro |
| AI 模型代数 | 旧版 DNN(Whisper 之前) | OpenAI Whisper(2022年至今) |
| 需要语音训练 | 是,需要初始配置文件训练 | 否,立即工作 |
| 准确度 | ~95%(训练后) | 99%(large-v3 模型) |
| GPU 加速 | 否,仅限 CPU | 支持 NVIDIA CUDA |
| 包含的语言 | ~10 种(其他需额外付费) | 29+ 种(全部包含) |
| 离线操作 | 部分(云同步功能) | 100% 具备离线能力 |
| 免费计划 | 否 | 每天 500 字,无需帐户 |
| 版本升级费用 | 付费的主要版本升级 | 免费的持续更新 |
| Microsoft Store | 否 | 是,可用 |
从历史上看,Dragon 的准确度提升需要录制语音训练课程,大声朗读段落以便软件能够根据您的声音进行校准。这非常耗时,并且当您的声音发生变化(生病、更换麦克风、噪音环境)时,必须维护和重新训练配置文件。OpenAI Whisper 基于 680,000 小时的各种音频进行训练,包括数百种口音、录音环境和语音风格。它在安装后立即以高准确度适用于大多数用户,无需语音配置文件。对于新用户来说,这是一个决定性的优势。对于那些一直在与配置文件损坏或重新训练要求作斗争的 Dragon 用户来说,切换到一个“开箱即用”的 Dragon NaturallySpeaking 替代方案是一种真正的解脱。
Dragon Professional Individual 的价格在 $200 到 $500 之间,具体取决于版本。面向医疗保健专业人员的 Dragon Medical 起价更高,并通过 Dragon Medical One 添加了按用户订阅的模式。如果您购买了 Dragon 15 并且一直在观望 Dragon 16 或更高版本是否值得升级费用,StarWhisper 彻底打破了这一循环。StarWhisper Pro 每月 $10(或每年 $80),其费用仅为 Dragon 预付费用的一小部分,并且所有未来的更新都包含在内,无需额外费用。一家用 StarWhisper Pro 年度许可证(总计 $800)替换 10 个 Dragon 许可证(每个 $500)的医疗保健机构,仅在第一年就能节省超过 $4,000。
Dragon 仅在 CPU 上运行。StarWhisper 支持 NVIDIA CUDA GPU 加速,可显著加快转录速度,这在使用更大、更准确的 Whisper 模型时尤为重要。RTX 3060 可以以近乎实时的速度运行 large-v3 模型。在大型模型上进行仅限 CPU 的推理每分钟音频需要几分钟的时间,而使用 CUDA,大多数片段的时间会缩短至 10 秒以内。对于需要最高准确度(医疗、法律)而又不想等待批处理的专业人士来说,GPU 加速使 StarWhisper 的大型模型在日常使用中变得实用,这是 Dragon 的旧架构根本无法比拟的。
Dragon 支持大约 10 种主要语言,额外的语言包单独出售,每种都需要大量额外费用。StarWhisper 在每个计划中都包含了 29+ 种语言,无需额外收费。底层的 Whisper 模型基于多语言数据进行训练,能够优雅地处理语言切换。对于多语言家庭、国际企业或使用多种语言听写的专业人士来说,StarWhisper 的语言广度是相对于 Dragon 商业化语言模型的一大优势。
Dragon NaturallySpeaking 的较新版本和 Dragon Medical One 通过云同步进行配置文件存储和功能更新。这使得它们不适合严格的离线环境,即使核心推理是在本地进行的。StarWhisper 的架构在转录方面完全没有云依赖。Whisper 模型通过 whisper.cpp 在您的机器上运行,任何音频数据都不会离开您的设备。对于一直使用旧版 Dragon 专门为了避免云暴露的医疗保健专业人员,StarWhisper 提供了相同的隐私保证,并具有更好的准确度和更低的价格标签。请参阅我们专门的医疗听写软件页面以了解临床工作流程的详细信息。
当您的麦克风改变、生病或移动到不同的声学环境时,Dragon 的语音配置文件会退化。配置文件损坏会强制进行可能需要 30-60 分钟的重新训练。为多个用户管理 Dragon 许可证的 IT 部门面临着持续的配置文件维护开销。
StarWhisper 的解决方案:没有语音配置文件。Whisper 的通用声学模型本质上可以处理说话者的变化。没有什么需要训练的,没有什么会损坏,也没有什么需要维护。每个设备上的每个用户从第一次使用起就能获得相同的高准确度模型。
Dragon 历来将主要版本作为付费升级出售。购买了 Dragon 13 的用户再次为 Dragon 15 付费,依此类推。这在已经很高的初始购买价格之上产生了经常性的升级成本,实际上使 Dragon 比它最初看起来更昂贵。
StarWhisper 的解决方案:每月 $10(或每年 $80),永远没有升级费用。对 StarWhisper 应用程序的所有改进,包括新的 Whisper 模型支持和功能添加,都包含在订阅中。年度计划特别奖励忠实用户,按每年 $80 计算,两年的 StarWhisper Pro 费用低于最便宜的 Dragon 版本的初始购买价格。
Dragon 的核心语音识别是在产生像 Whisper 这样的模型的 Transformer 时代之前构建的。在带口音的英语、非英语语言和混合语言内容上,Dragon 的旧版 DNN 架构的表现不如基于现代 Transformer 的模型。Dragon 的语言包也需要额外付费,并且只涵盖 Whisper 语言范围的一小部分。
StarWhisper 的解决方案:OpenAI Whisper 的架构使用单一模型处理所有支持的语言,没有单独的包,没有按语言定价。large-v3 模型在 Dragon 一直难以处理的带口音语音、技术词汇和混合语言内容上实现了很高的准确度。
面向从 Dragon 过渡到 StarWhisper 的个人用户和 IT 管理员的实用指南。
Dragon 允许您导出自定义词汇(术语、专有名词、技术术语)。在卸载之前捕获这些内容。您可以将该列表用作参考,以验证 StarWhisper 是否正确处理它们。Whisper 原生处理许多技术术语,请在手动标记例外情况之前进行测试。
从 starwhisper.ai 下载。使用免费计划对您的典型内容运行准确度测试。说出您通常领域的示例段落并比较结果。大多数 Dragon 用户发现 StarWhisper 的准确度无需任何配置即可匹配或超过他们训练有素的 Dragon 配置文件。
在“设置”中配置 StarWhisper 的按讲热键。Dragon 用户通常依赖专用的麦克风按钮或键盘快捷键,StarWhisper 支持任何键盘热键或鼠标按钮分配。浮动小部件会出现在您正在工作的任何地方。
Small 模型:我们推荐用于实时听写的实用默认模型,快速且非常适合一般用途,包括大多数医疗、法律和技术内容。Medium(Pro):适用于非拉丁字母(中日韩、阿拉伯语、西里尔字母)和长篇音频。Large-v3(Pro):最好保留用于长录音的批量转录;在简短的实时听写片段上,small 通常表现得一样好甚至更好。GPU 用户可以在实时听写时保持在 small,仅在批处理作业时切换到 large-v3。
Dragon 是一个资源密集型应用程序。卸载它会释放大量的 RAM 和磁盘空间。StarWhisper 的轻量级架构意味着您会注意到整体系统响应能力的差异,特别是在将 Dragon 作为后台服务运行的机器上。
需要符合 HIPAA 要求的离线听写的医生和护士,成本仅为 Dragon Medical 的一小部分。请参阅医疗听写软件以了解工作流程的详细信息。
听写案情摘要、案件笔记和信件的律师。离线操作确保客户特权保护。探索法律听写软件的注意事项。
每天听写数千字的小说家、记者和内容制作者。无需训练,无需配置文件,只需在任何写作应用程序中准确输出。请参阅我们的作家听写软件指南。
在多个工作站上替换 Dragon 的组织。没有按用户的培训开销,部署更简单,并且在规模上具有大幅降低的许可证成本。
Dragon 的多语言支持既昂贵又有限。StarWhisper 基于 Whisper 的引擎可处理 29+ 种语言。在设置中切换语言,无需购买额外的包。
任何拥有 NVIDIA GPU 的人都可以在 StarWhisper 中利用 CUDA 加速,以近乎实时的速度运行最准确的 Whisper 模型。Dragon 不提供同等的 GPU 利用率。
在清晰的音频上,是的,Whisper large-v3 模型实现了大约高准确度,而 Dragon 在训练有素的配置文件上约为 95%。更显著的优势在于各种音频:Whisper 可以处理带口音的语音、非母语英语和特定领域的词汇,而无需按用户进行训练。当说话者偏离系统训练所用的标准美国英语语音配置文件时,Dragon 的准确度会下降。
Nuance 于 2022 年被 Microsoft 收购。自收购以来,Dragon 消费者产品线的投资有所减少。Dragon Medical One 继续接收更新,但正转向云订阅模式。Dragon Professional Individual 接收维护更新,但与像 Whisper 这样的开源模型中正在发生的快速迭代相比,主要的 AI 模型改进已经放缓。
Dragon 拥有广泛的语音命令系统,如“新段落”、“选择那个”、“加粗那个”,这些系统超越了转录,进入了文档控制。StarWhisper 专注于转录准确度而不是语音命令。如果您的工作流程严重依赖 Dragon 的语音命令宏,StarWhisper 可以通过口语(“逗号”、“句号”)覆盖基本标点符号,但无法复制 Dragon 的完整命令集。
Dragon 永久许可证在您停止使用该软件后仍然有效,除非您使用的是订阅计划,否则没有什么需要取消的。您可以卸载 Dragon 并保留许可证密钥,以备不时之需,尽管大多数切换到 StarWhisper 的用户都不会再返回。基于订阅的 Dragon Medical One 取消遵循标准的 Nuance 计费政策。
StarWhisper 通过 Windows 辅助功能 API 在任何 Windows 应用程序(包括本机应用程序、像 VS Code 和 Slack 这样的 Electron 应用程序、Office 应用程序和基于浏览器的工具)的活动光标位置插入转录文本。Dragon 传统上与特定应用程序(自定义 Word 功能区、EHR 集成)有更深入的集成。StarWhisper 的光标注入方法集成度较低但更通用:如果您可以在其中输入,StarWhisper 就可以听写到其中。
是的。StarWhisper 既可以直接从 starwhisper.ai 下载,也可以通过 Microsoft Store 获取。Microsoft Store 版本是沙盒化的,可能有不同的更新时间,但提供相同的核心功能。更喜欢 Microsoft Store 托管部署的企业 IT 部门可以使用该渠道以便于分发。
现代 AI 准确度,无需语音训练,完全离线操作和 GPU 加速,成本比 Dragon 低 90%。免费下载 StarWhisper,看看最新一代的 Dragon NaturallySpeaking 替代方案与十年前的架构相比如何。
Windows 10/11 • 无需语音训练 • 每天 500 字免费 • 支持 CUDA 加速