Entrada de voz em japonês. Dite japonês em qualquer aplicativo Windows com conversão automática de kanji, hiragana e katakana. Ignore o IME completamente. Grátis para 500 palavras por dia.
Saída de script nativo, formas polidas e sem manuseio de IME
Saída na ortografia mista em que o japonês é realmente escrito. Substantivos comuns em kanji, partículas em hiragana, palavras emprestadas estrangeiras em katakana. Sem menus de candidatos de conversão.
Pule o pipeline de conversão romaji-kana-kanji que desacelerou a digitação em japonês por décadas. Fale a frase, a transcrição aparece no cursor no script misto correto.
Formas polidas (です/ます), formas humildes (謙譲語) e formas honoríficas (尊敬語) são transcritas como faladas. E-mail de negócios, correspondência com clientes, documentos formais - tudo funciona.
Nomes de marcas em inglês, termos técnicos e frases curtas embutidos em frases japonesas aparecem corretamente. A escrita de tecnologia, finanças e consultoria flui naturalmente.
O Modo Local mantém o áudio na sua máquina Windows. Comunicações confidenciais com clientes, memorandos internos da empresa e escrita pessoal nunca saem do prédio.
500 palavras por dia, 3.500 por semana. O Pro por $10/mês desbloqueia ditado ilimitado para escrita japonesa de alto volume.
Digitar em japonês no Windows tem sido o mesmo fluxo de trabalho doloroso há trinta anos. Você digita romaji no IME, assiste ele converter para hiragana, aperta espaço para ver os candidatos de conversão kanji, escolhe o correto, repete para cada palavra. Até os digitadores experientes atingem um teto bem abaixo da velocidade de pensamento devido à sobrecarga cognitiva de monitorar a janela de candidatos do IME. O ditado de voz elimina todo esse processo.
StarWhisper usa o modelo Whisper da OpenAI para transcrever áudio japonês diretamente para a ortografia mista kanji-hiragana-katakana em que o japonês é realmente escrito. Você fala em japonês natural, a transcrição aparece no seu cursor no script correto, sem menus de IME, sem candidatos de conversão, sem a dança das teclas Tab e Enter. O aplicativo é uma ferramenta desktop Windows, então funciona no Word, Outlook, OneNote, Excel, Teams, Slack, Notion, seu navegador e qualquer outro aplicativo Windows com entrada de texto.
O japonês é uma das línguas suportadas pelo Whisper, com dados de treinamento substanciais de transmissões japonesas, podcasts, animes, dramas, notícias e YouTube. O modelo aprendeu não apenas sons e gramática japoneses, mas as convenções ortográficas japonesas: quais palavras são convencionalmente escritas em kanji, quais permanecem em hiragana e quais aparecem em katakana. É esse seguimento de convenção que torna a saída utilizável sem pós-edição manual.
O japonês é escrito com três scripts simultaneamente. Kanji (caracteres chineses) carregam o conteúdo lexical de substantivos, raízes de verbos e raízes de adjetivos. Hiragana lida com partículas gramaticais, terminações de conjugação verbal e palavras japonesas nativas para as quais o kanji parece pesado. Katakana usa palavras emprestadas estrangeiras, onomatopeias e certos usos estilísticos. Escritores nativos transitam constantemente entre os três dentro de uma única frase, e as regras sobre qual script usar onde são parcialmente convencionais e parcialmente estilísticas.
Whisper produz essa ortografia mista diretamente. Uma frase de exemplo como 「今日の会議は午後3時に変更になりました」 ("A reunião de hoje foi alterada para as 15h") sai exatamente como escrita, com 今日, 会議, 午後 em kanji, 時, 変更 em kanji, partículas の, は, に em hiragana, e a terminação verbal なりました em hiragana. Você não digitou romaji; você falou a frase e a transcrição corresponde ao que um escritor nativo produziria.
O katakana para palavras emprestadas estrangeiras é automático. Computer se torna コンピューター, meeting se torna ミーティング, project se torna プロジェクト, system se torna システム. Nomes de marcas e nomes próprios em inglês permanecem em seu script latino original (Microsoft, Google, GitHub). A saída flui para qualquer aplicativo Windows na velocidade nativa.
O japonês possui registros elaborados de polidez que o inglês não tem. A mesma ideia pode ser expressa na forma simples para amigos, forma polida para colegas e conhecidos, forma humilde ao descrever suas próprias ações em ambientes formais e forma honorífica ao descrever as ações de alguém que você respeita. O japonês de negócios, em particular, depende de uma combinação em camadas desses registros, e calibrá-los incorretamente é um risco profissional real.
Whisper transcreve keigo exatamente como falado, sem normalização. Se você ditar お世話になっております (uma abertura padrão de correspondência de negócios), é isso que aparece na transcrição. Se você ditar ご確認いただけますでしょうか (uma maneira educada de solicitar revisão), isso aparece literalmente. Se você ditar ありがとうございます ou ありがとう, você recebe exatamente o que disse. O modelo não "conserta" seu registro para cima ou para baixo.
Isso torna o ditado de e-mail de negócios em japonês diretamente utilizável. Os padrões comuns de abertura, corpo e fechamento de e-mails de negócios (お世話になっております, さて, ご検討のほどよろしくお願いいたします) aparecem de forma limpa. O bate-papo interno da equipe em japonês simples ou semi-formal funciona da mesma maneira. Documentos voltados para clientes que exigem keigo sustentado podem ser ditados na velocidade da fala em vez de digitados frase por frase.
O japonês de negócios padrão (営業, 経理, 取引先, 案件, 見積もり, 請求書, 納期, 検収) é bem representado nos dados de treinamento e aparece corretamente. O japonês técnico padrão (システム, データベース, インターフェース, クラウド, API, リリース, デプロイ) é reconhecido tanto para o lado das palavras emprestadas em katakana quanto para o lado japonês nativo.
A terminologia específica da indústria varia. Termos comuns em grandes indústrias (finanças, TI, marketing, consultoria, manufatura, varejo) geralmente funcionam. Termos muito especializados (vocabulário científico raro, terminologia jurídica de nicho, jargão interno da empresa) podem ser transcritos foneticamente e precisar de correção. Uma lista pessoal de encontrar e substituir lida com os culpados recorrentes. O modelo não aprende com suas correções de sessão para sessão, o que mantém seus dados locais, mas significa que os termos consistentes permanecem consistentes.
Para fluxos de trabalho de escrita japonesa longa, veja o página de voz para texto para criadores de conteúdo ; o mesmo fluxo de trabalho se aplica à saída em japonês. Para fluxos de trabalho multilíngues em geral, a página de recursos multilíngues cobre o conjunto completo suportado.
O local de trabalho e a escrita acadêmica moderna em japonês incorporam rotineiramente nomes de marcas em inglês, termos técnicos em inglês e frases curtas em inglês dentro de frases japonesas. Uma frase como 「明日のMTGでSlackの新機能についてレビューします」 ("A reunião de amanhã revisará os novos recursos do Slack") é normal em locais de trabalho de tecnologia. Whisper lida com esse tipo de entrada mista sem quebrar o fluxo japonês.
Defina o idioma StarWhisper como Japonês para conteúdo predominantemente japonês. Nomes de marcas em inglês, abreviações e frases curtas embutidos aparecem com o caso original preservado. O modelo também reconhece transliterações em katakana de palavras em inglês onde o japonês as adotou (a mesma palavra pode aparecer como o inglês original ou como a versão em katakana, dependendo do que o falante usou). Para documentos que alternam entre parágrafos longos em inglês e longos em japonês, mude o idioma para Detecção Automática para que o motor selecione por segmento.
Para fluxos de trabalho de tradução de japonês para inglês, dite a fonte em japonês em um documento e use qualquer ferramenta de tradução de sua escolha no resultado. Para a redação de inglês para japonês, dite diretamente em japonês em vez de ditar em inglês e traduzir depois. A qualidade da saída é consistentemente melhor quando você fala no idioma de destino.
Mensagens do Outlook e Gmail, atualizações internas da equipe, acompanhamento com clientes, correspondência formal em keigo. O formato de e-mail comercial japonês, com abertura お世話になっております, corpo e fechamento よろしくお願いいたします, é ditado de forma limpa. Ditar um e-mail comercial mais longo em japonês leva aproximadamente um terço do tempo de digitá-lo por meio de um IME, e revisar o resultado é mais rápido do que monitorar os candidatos de conversão palavra por palavra.
Autores de light novel, roteiristas de manga e escritores de novelas visuais podem ditar rascunhos iniciais na velocidade da fala. O diálogo em diferentes registros de personagens (casual, educado, arcaico, linguagem de papel) é transmitido como falado. Passagens narrativas longas em japonês padrão funcionam perfeitamente. Para trabalhos de ficção longa, o plano Pro ilimitado remove o limite diário de palavras. Veja o voice-to-text para escritores página para fluxos de trabalho gerais de longa forma.
Transcrever reuniões gravadas, entrevistas, palestras e podcasts para texto em japonês. StarWhisper suporta ditado em tempo real e transcrição de arquivos de áudio. O japonês padrão em condições de gravação claras é transcrito com precisão.
Tradutores que trabalham para o japonês podem ditar suas traduções diretamente em vez de digitar por meio de um IME. A saída é de qualidade de rascunho e se beneficia de uma passagem de polimento, mas a vantagem de velocidade sobre a digitação por IME é substancial. Trabalhar a partir de material de origem em inglês falado como tradução japonesa é mais rápido do que digitar.
Diário, posts de blog, mídias sociais, artigos Notion, threads no Twitter/X em japonês. O nível gratuito cobre a maioria dos volumes de escrita pessoal. Para usuários que escrevem em japonês diariamente como parte de um fluxo de trabalho de conteúdo, o Pro é mais adequado.
O Japão historicamente foi mal atendido por ferramentas ocidentais de ditado de voz porque a complexidade do script, a cultura de digitação centrada em IME e os dados de treinamento limitados em japonês em sistemas mais antigos de reconhecimento de fala combinaram para produzir resultados ruins. Whisper mudou isso no lado do motor; a lacuna entre a qualidade de saída em japonês e inglês é muito menor do que era mesmo há três anos.
Os dados do funil StarWhisper mostram que o Japão gera cerca de 14 instalações diárias do aplicativo Windows, o que é um mercado significativo e em crescimento. A taxa de sucesso inicial atual para usuários japoneses está em torno de 16,7 por cento, inferior à taxa de 57 por cento vista para usuários alemães no mesmo conjunto de dados. Essa lacuna reflete duas coisas: atrito de configuração específico para usuários japoneses (seleção de script, configurações de idioma, configuração de microfone) e a dificuldade genuína do ditado quando a entrada é japonês natural misturado com inglês embutido. Ambos estão melhorando à medida que o produto itera.
Para usuários japoneses que consideram se o ditado de voz é finalmente bom o suficiente para substituir a digitação por IME para escrita diária, a resposta prática é que a qualidade do motor está lá; o fator limitante é agora a configuração e o hábito. O nível gratuito permite que você teste o fluxo de trabalho em sua própria máquina sem compromisso. O FAQ cobre perguntas comuns de configuração em japonês, e o modo de privacidade e offline página explica a postura de processamento local.
| Plano | Palavras | Preço (USD) |
|---|---|---|
| Free | 500 palavras/dia, 3.500/semana | $0 |
| Pro Monthly | Ilimitado | $10/mês |
| Pro Annual | Ilimitado | $80/ano ($6.67/mês) |
A cobrança é feita através do Stripe em USD. Seu banco converte para JPY na taxa prevalecente. Não há taxa separada para o Japão; o pacote de 96+ idiomas, incluindo japonês, vem instalado no instalador gratuito. As contagens de palavras são medidas com uma heurística sensata para o japonês, onde a densidade de caracteres por "palavra" é muito maior do que para o inglês.
O nível gratuito é genuinamente utilizável para volumes de escrita pessoal em japonês: e-mail comercial, diário, posts de blog, mídias sociais. O Pro por $10 por mês faz sentido para usuários que escrevem japonês de longa forma diariamente: romancistas, tradutores, jornalistas, correspondentes comerciais em tempo integral e criadores de conteúdo. O plano anual economiza cerca de um terço em comparação com a cobrança mensal. O detalhamento completo de preços está na seção de preços da página inicial. O página de explica como o nível gratuito funciona sem qualquer compromisso recorrente.
StarWhisper funciona em Windows 10 e Windows 11. Não em Mac, não em dispositivos móveis. O instalador tem cerca de 100 MB; os arquivos do modelo Whisper são baixados no primeiro uso. O funcionamento apenas com CPU funciona em qualquer máquina Intel ou AMD razoavelmente moderna. Uma GPU NVIDIA com CUDA acelera significativamente os modelos maiores, útil para transcrição japonesa de alto volume. Vulkan fornece um caminho de GPU cross-vendor para GPUs dedicadas AMD e Intel.
Para ditado em japonês, o modelo Whisper médio ou grande é recomendado em vez do modelo pequeno porque o japonês se beneficia mais dos parâmetros extras do que o inglês. O modelo grande é a opção de maior precisão se sua máquina puder executá-lo.
A qualidade do microfone importa mais do que você pode esperar. Um headset USB ou um microfone de mesa direcional produz uma transcrição japonesa visivelmente mais limpa do que um microfone embutido em laptop, especialmente para falantes de voz suave ou salas com ruído de fundo. O investimento em um microfone USB de 5.000 ienes se paga rapidamente na redução do tempo de correção. Para mais informações sobre o lado da GPU, veja a página de recurso de aceleração GPU.
Outras páginas do StarWhisper que combinam bem com ditado em japonês
Umlauts, substantivos compostos e dialetos da região DACH. Processamento local amigável ao GDPR.
Espanhol castelhano, mexicano, argentino e caribenho com pontuação invertida.
Fluxos de trabalho de redação de longa forma que funcionam em qualquer idioma suportado, incluindo japonês.
O pacote completo de 96+ idiomas que acompanha o instalador gratuito do StarWhisper.