日语语音输入。将日语输入到任何Windows应用,并自动完成汉字、平假名和片假名转换。完全跳过IME。每天免费500词。
原生脚本输出、敬语形式,无需在IME中切换
输出为日语实际书写使用的混合正字法。普通名词使用汉字,助词使用平假名,外来词使用片假名。没有转换候选菜单。
跳过困扰日语输入数十年的罗马字-平假名-汉字转换流程。说出句子,转录文本将以正确的脚本混合形式出现在光标处。
敬语形式(です/ます)、谦让语(謙譲語)和尊敬语(尊敬語)都按口语转录。无论是商务邮件、客户信函还是正式文件,都能完美使用。
嵌入日语句子的英语品牌名称、技术术语和短语都能正确传达。无论是科技、金融还是咨询领域的写作,都能流畅自然。
本地模式将音频保留在您的Windows设备上。机密的客户通信、内部公司备忘录和个人写作内容绝不会离开本地。
每天500词,每周3,500词。Pro版每月$10,可解锁无限语音输入,满足高容量日语写作需求。
在Windows上打日语输入法已经是一个痛苦的工作流程长达三十年。您需要将罗马字输入到IME,观察它转换为平假名,按空格键查看汉字转换候选,选择正确的选项,然后对每个词重复此过程。即使是经验丰富的打字员,也会因为持续监控IME候选窗口带来的认知负担,导致输入速度远低于思考速度。语音输入彻底消除了整个流程。
StarWhisper 使用OpenAI的Whisper模型,将日语音频直接转录为日语实际书写使用的混合汉字-平假名-片假名正字法。您说出自然日语,转录文本将以正确的脚本形式出现在光标处,没有IME菜单,没有转换候选,无需按Tab和Enter键。该应用程序是一个Windows桌面工具,因此它可以在Word、Outlook、OneNote、Excel、Teams、Slack、Notion、您的浏览器以及任何其他带有文本输入的Windows应用中使用。
日语是Whisper支持的语言之一,拥有来自日本广播、播客、动漫、戏剧、新闻和YouTube的大量训练数据。该模型不仅学习了日语的发音和语法,还学习了日语的拼写惯例:哪些词汇习惯上使用汉字,哪些保留平假名,哪些使用片假名。正是这种遵循惯例的能力,使得输出无需手动后期编辑即可使用。
日语同时使用三种脚本书写。汉字(中文字符)承载名词、动词词根和形容词词根的词汇内容。平假名处理语法助词、动词变位结尾以及使用汉字会显得笨重的本土日语词汇。片假名用于外来词、拟声词和某些风格化的用法。母语作家在单个句子中会不断在这三种脚本之间切换,而使用哪种脚本的规则部分是惯例,部分是风格化的。
Whisper直接生成这种混合正字法。例如“今日の会議は午後3時に変更になりました”(“今天的会议改到下午3点”)这样的示例句子,会准确地输出:今日、会議、午後使用汉字;時、変更使用汉字;助词の、は、に使用平假名;动词结尾なりました使用平假名。您没有输入任何罗马字;您说出了句子,转录文本与母语作家产出的内容完全匹配。
外来词的片假名转换是自动的。Computer变为コンピューター,meeting变为ミーティング,project变为プロジェクト,system变为システム。品牌名称和英语专有名词保留其原始拉丁字母形式(Microsoft, Google, GitHub)。输出可以以原生速度流式传输到任何Windows应用。
日语拥有英语所不具备的复杂敬语等级。同一个想法可以对朋友使用普通形式,对同事和熟人使用礼貌形式,在正式场合描述自己行为时使用谦让语,描述尊敬他人行为时使用尊敬语。特别是商务日语,依赖于这些等级的层次组合,误用这些等级本身就是一种实际的职业风险。
Whisper转录敬语时不会进行标准化处理,而是精确地转录您所说的话。如果您说出お世話になっております(标准的商务信函开头),转录文本就是这个。如果您说出ご確認いただけますでしょうか(委婉请求审阅的方式),转录文本就是这个。如果您说出ありがとうございます或ありがとう,您得到的就是您所说的话。模型不会“修正”您的敬语等级。
这使得日语商务邮件语音输入可以直接使用。商务邮件常见的开头、主体和结尾模式(お世話になっております, さて, ご検討のほどよろしくお願いいたします)都能清晰地传达。无论是普通日语还是半正式日语的内部团队聊天,效果都是一样的。需要持续使用敬语的客户文件,现在可以以说话的速度进行语音输入,而不是逐句打字。
标准商务日语(営業, 経理, 取引先, 案件, 見積もり, 請求書, 納期, 検収)在训练数据中得到了很好的体现,并且能正确识别。标准技术日语(システム, データベース, インターフェース, クラウド, API, リリース, デプロイ)在片假名外来词和本土日语方面都能得到识别。
行业特定术语各不相同。主要行业(金融、IT、营销、咨询、制造、零售)的通用术语通常都能使用。非常专业的术语(罕见的科学词汇、小众法律术语、内部公司行话)可能会被音译,需要人工修正。个人查找和替换列表可以处理重复出现的错误。模型不会从一次修正中学到知识,这保持了您的数据本地化,但也意味着一致的术语会保持一致。
有关长篇日语写作工作流程,请参阅 内容创作者的语音转文本 页面;相同的流程适用于日语输出。对于多语言工作流程,一般而言, 多语言功能页面 涵盖了所有支持的语言集。
现代日语工作场所和学术写作经常在日语句子中嵌入英语品牌名称、英语技术术语和短英语短语。像“明日のMTGでSlackの新機能についてレビューします”(“明天会议将回顾Slack的新功能”)这样的句子在科技工作场所很常见。Whisper可以在不破坏日语流畅性的情况下处理这类混合输入。
对于以日语为主的内容,请将StarWhisper语言设置为日语。嵌入的英语品牌名称、缩写和短语会保留原始大小写。模型还会识别日语采纳的英语词汇的片假名转写(根据说话者使用的是原始英语还是片假名版本,同一个词可能会以不同的形式出现)。对于在长篇英语和长篇日语段落之间切换的文档,请将语言切换到自动检测,以便引擎按段落选择。
对于日语到英语的翻译工作流程,请将日语源文本录入到一个文档中,然后使用您选择的任何翻译工具处理结果。如果进行英语到日语的起草,请直接用日语进行口述,而不是先口述英语再进行翻译。当您使用目标语言进行口述时,输出质量始终更佳。
适用于 Outlook 和 Gmail 邮件、内部团队更新、客户跟进、正式的敬语信函。日语商务邮件格式,包括“お世話になっております”的开头、正文和“よろしくお願いいたします”的结尾,口述时能清晰地呈现。口述一封较长的商务邮件,所需时间大约只有通过 IME 输入的一三分之一,而且审阅结果的速度也比逐字检查转换候选词要快得多。
轻小说作家、漫画剧本作家和视觉小说作家可以直接以说话的速度口述初稿。不同角色语气的对话(休闲、礼貌、古体、角色语言)都能如口述般呈现。标准日语的长篇叙事段落处理效果良好。对于长篇小说创作,无限量的 Pro 套餐消除了每日字数限制。请查看 写作者的语音转文本功能 用于通用长篇工作流程的页面。
将会议记录、访谈、讲座和播客等录音转录成日语文本。StarWhisper 支持实时口述和音频文件转录。在清晰的录音条件下,标准日语转录准确率高。
翻译人员可以直接口述他们的译文,而不是通过 IME 输入。输出结果是初稿质量,需要进行润色,但相比于 IME 输入,速度优势非常显著。将口述的英语源材料作为日语译文进行工作,比手动输入更快。
日语日记、博客文章、社交媒体、Notion 文章、Twitter/X 帖子。免费套餐涵盖了大多数个人写作需求。对于每天将日语作为内容工作流进行写作的用户,Pro 套餐更适合。
历史上,日本由于脚本的复杂性、以 IME 为中心的输入文化,以及老式语音识别系统有限的日语训练数据,一直未能得到西方语音口述工具的充分服务。Whisper 在引擎层面改变了这一点;现在日语和英语的输出质量差距远小于三年前。
StarWhisper 的漏斗数据显示,日本每天大约产生 14 次 Windows 应用安装,这是一个有意义且不断增长的市场。目前,日本用户的首次成功率约为 16.7%,低于同一数据集上德国用户看到的 57% 的比率。这一差距反映了两个方面:特定于日本用户的设置摩擦(脚本选择、语言设置、麦克风配置),以及当输入是混合的自然日语和嵌入的英语时,口述本身的难度。随着产品迭代,这两点都在改进。
对于考虑是否用语音口述取代日常写作中的 IME 输入的日本用户来说,实际答案是引擎质量已经足够好;限制因素现在是设置和习惯。免费套餐让您可以在自己的设备上无负担地测试工作流程。请查看 FAQ 涵盖了常见的日语设置问题,以及 隐私和离线模式 该页面解释了本地处理的机制。
| 套餐 | 字数 | 价格 (USD) |
|---|---|---|
| 免费 | 500 字/天, 3,500/周 | $0 |
| Pro 月度 | 无限 | $10/月 |
| Pro 年度 | 无限 | $80/年 ($6.67/月) |
账单通过 Stripe 以 USD 结算。您的银行会按当时的汇率转换为 JPY。日本没有单独的费用;包含日语的 96+ 语言包在免费安装程序中就已包含。字数统计采用了合理的日语启发式算法,即日语的“词”的字符密度远高于英语。
免费套餐对于个人日语写作量(商务邮件、日记、博客文章、社交媒体)是真正可用的:Pro 套餐每月 $10,适合每天进行长篇日语写作的用户:小说家、翻译、记者、全职商务撰稿人和内容创作者。年度套餐比按月付费节省了约三分之一。完整的定价明细请查看 首页定价部分. 请查看 无订阅 该页面解释了免费套餐如何在没有任何定期承诺的情况下工作。
StarWhisper 适用于 Windows 10 和 Windows 11。不适用于 Mac 或移动设备。安装程序约为 100 MB;Whisper 模型文件在首次使用时下载。仅使用 CPU 的操作可以在任何合理现代的 Intel 或 AMD 机器上运行。配备 CUDA 的 NVIDIA GPU 可以显著加速大型模型,这对于高容量的日语转录非常有用。Vulkan 为 AMD 和 Intel 独立 GPU 提供了一个跨厂商的 GPU 路径。
对于日语口述,推荐使用中型或大型 Whisper 模型,而不是小型模型,因为日语从额外的参数中获得的益处大于英语。如果您的机器可以运行,大型模型是准确率最高的选择。
麦克风质量比您想象的更重要。与笔记本内置麦克风相比,USB 耳机或定向桌面麦克风能产生明显更清晰的日语转录,特别是对于声音较轻的说话者或背景有噪音的房间。投资一个 5,000-yen 的 USB 麦克风,能通过减少校对时间很快收回成本。有关 GPU 方面的更多信息,请查看 GPU 加速功能页面.
与日语口述搭配使用的其他StarWhisper页面