Dite prompts de 500 palavras diretamente na caixa de entrada do ChatGPT, em qualquer navegador ou no aplicativo desktop. StarWhisper é um atalho de voz para texto local no Windows que funciona no ChatGPT, Claude, Gemini, Perplexity, Cursor, e em qualquer campo de texto.
Da instalação ao ditado direto no ChatGPT em menos de cinco minutos.
Baixar StarWhisper de starwhisper.ai ou da Microsoft Store. A instalação leva cerca de um minuto. No primeiro uso, permita o acesso ao microfone. O plano grátis cobre 500 palavras por dia, o que é mais do que suficiente para vários prompts longos.
Acesse chatgpt.com no Chrome, Edge, Firefox, Brave ou qualquer navegador. Ou abra o aplicativo desktop oficial do ChatGPT para Windows. O fluxo de ditado é idêntico para ambos. Comece uma nova conversa ou continue uma existente.
Posicione o cursor no campo de entrada de texto da mensagem na parte inferior da conversa. Este é o campo rotulado como "Pergunte qualquer coisa" ou similar. O StarWhisper digita em qualquer controle de texto do Windows que tenha foco no momento, então o cursor precisa estar no lugar certo antes de você começar.
Pressione e segure o atalho de ditado global. O padrão funciona para a maioria das configurações, e você pode remapeá-lo nas Configurações se preferir outra coisa. O ícone StarWhisper mostra o estado de gravação para que você saiba que seu microfone está ativo antes de começar a falar.
Dite o prompt inteiro no ritmo que você falaria naturalmente. Instruções longas, contexto, exemplos, restrições, formato de saída solicitado, tudo. Faça pausas onde as frases terminam. O Whisper cuida da pontuação automaticamente. Você pode falar em qualquer um dos 96 idiomas suportados.
Quando você solta o atalho, o StarWhisper transcreve localmente e cola o resultado na caixa de entrada do ChatGPT. Leia, corrija quaisquer palavras que o Whisper tenha entendido errado, adicione um esclarecimento se necessário e, em seguida, clique em Enviar. Seu prompt só chega à OpenAI quando você clica em Enviar, exatamente como se você o tivesse digitado.
Vantagens específicas para usuários que escrevem prompts longos e estruturados.
O prompt chega como texto na caixa de entrada, onde você pode lê-lo, reestruturá-lo, adicionar marcadores, colar código e refinar antes de enviar. O modo de voz envia assim que você termina de falar.
ChatGPT, Claude, Gemini, Perplexity, Mistral, You.com, Poe, chat OpenRouter, qualquer IA baseada em navegador recebe o texto ditado de forma idêntica. O mesmo vale para Cursor, VS Code, JetBrains, Slack, Discord, Notion, Word, Gmail.
Mantenha o atalho pressionado, dite no seu ritmo, solte quando terminar. Prompts de vários parágrafos com exemplos e instruções chegam completos. Não há necessidade de ficar dentro de uma janela de conversa em modo de voz ou se preocupar com o ChatGPT interrompendo você.
O áudio é processado no seu PC com o Whisper rodando localmente. Sua fala não é enviada para nenhum serviço de transcrição de terceiros antes de chegar ao ChatGPT. O texto só vai para a OpenAI quando você decide clicar em Enviar.
500 palavras por dia no plano grátis cobre vários prompts longos por dia. O Pro custa $10 por mês ou $80 por ano para ditado ilimitado em toda a sua escrita diária, não apenas no ChatGPT.
Dite prompts no seu idioma nativo e peça ao ChatGPT para responder em qualquer idioma que você prefira. Útil para criadores de conteúdo, tradutores e qualquer pessoa cujo raciocínio seja mais rápido em um idioma do que em outro.
Quanto mais você usa o ChatGPT, mais longos ficam seus prompts. Um usuário casual escreve "resuma este artigo". Um usuário avançado escreve um briefing de vários parágrafos com atribuição de função, contexto, exemplos de bom e mau resultado, restrições, formato alvo e uma lista de casos extremos a serem tratados. Esse prompt tem de 300 a 800 palavras. Digitar leva de cinco a quinze minutos. Falar leva de um a três.
A diferença de velocidade é mais importante do que parece. A qualidade do prompt é a maior variável na qualidade da saída do ChatGPT. Quando digitar um prompt longo parece lento, você toma atalhos, omite contexto, pula exemplos que teriam guiado a resposta. Quando ditar é rápido, você inclui tudo. O modelo recebe um briefing melhor, a saída melhora, e o bate-papo fica mais curto. StarWhisper é construído para tornar este ciclo rápido.
O ditado também é menos fatigante para trabalho repetitivo. Qualquer pessoa que use o ChatGPT o dia todo, profissionais de marketing de conteúdo, redatores, desenvolvedores, fundadores, engenheiros de suporte, pessoas de operações automatizando fluxos de trabalho, sabe que a carga cumulativa do pulso de digitar prompts aumenta. Mudar para a voz no lado da entrada corta essa carga pela metade.
A OpenAI tem seu próprio modo de voz para o ChatGPT. É um ótimo produto para um caso de uso diferente. Ambos merecem uma comparação clara.
| Capacidade | Modo de Voz do ChatGPT | Ditado StarWhisper no ChatGPT |
|---|---|---|
| Melhor para | Interação conversacional | Prompts longos e estruturados, edição antes de enviar |
| Saída que você obtém | Resposta falada ou texto, em uma sessão de voz | Texto na caixa de prompts que você pode refinar |
| Funciona com Claude/Gemini/Perplexity | Não | Sim, fluxo idêntico |
| Funciona em Cursor, VS Code, Word, Notion | Não | Sim, qualquer campo de texto |
| Manuseamento de áudio | Transmitido para a OpenAI | Processado localmente no Modo Local padrão |
| Assinatura | Requer ChatGPT Plus ou Team | Plano grátis cobre ditado diário, Pro $10/mês |
| Idiomas | Conjunto suportado é menor | 96 via Whisper |
O modo de voz é ótimo quando você quer conversar com o ChatGPT como uma pessoa. O ditado na caixa de prompts é melhor quando você quer escrever um briefing cuidadoso e detalhado, editá-lo e só então enviar.
Dite o briefing para um artigo de 1.500 palavras. Fale o ângulo, o público-alvo, os três subtópicos, o chamado à ação e as notas de voz da marca. Edite o briefing ditado, envie para o ChatGPT, obtenha um rascunho. Repita para esboços e reescritas. Para mais informações, veja voice-to-text para criadores de conteúdo.
Dite a descrição de um refator em inglês simples, cole o código existente, peça ao ChatGPT ou Claude a mudança. Ou dite casos de teste como descrições em linguagem natural. Funciona igualmente bem em Cursor e VS Code, ambos apenas entradas de texto para o StarWhisper.
Dite uma pergunta longa com todo o contexto, fontes e restrições relevantes que você de outra forma resumiria. Obtenha uma resposta mais fundamentada porque o modelo tem o briefing completo desde o início.
Dite prompts estratégicos durante uma caminhada ou deslocamento (com microfone de headset no Windows). Edite quando voltar para a mesa. Envie. É assim que muito trabalho de estratégia acontece em 2026.
Esta é uma pergunta frequente e razoável. O StarWhisper Local Mode executa o Whisper no seu próprio CPU ou GPU. O áudio é capturado pelo seu microfone, processado na memória do seu dispositivo e convertido em texto sem nenhuma chamada de rede. Nada é enviado em lugar algum durante a transcrição. O texto que o StarWhisper passa para a caixa de entrada do ChatGPT é o mesmo texto que você teria digitado.
Quando você então clica em Enviar no ChatGPT, o seu texto de prompt chega aos servidores da OpenAI, o que não é diferente de digitar manualmente. Se sua preocupação é a OpenAI ver o conteúdo do prompt, a ditação não muda isso. Se sua preocupação é um serviço de transcrição de terceiros receber seu áudio bruto, o Local Mode resolve isso completamente.
Há uma opção de ativação Modo Cloud para casos em que você deseja a máxima precisão em áudios difíceis. Ele usa a API Whisper da OpenAI. Nunca é ativado por surpresa, a escolha é visível na interface do StarWhisper, e você pode permanecer no Local Mode permanentemente se for o que prefere.
Com algumas sessões, o fluxo de trabalho se torna natural e o ganho de velocidade em relação à digitação é grande o suficiente para que a maioria dos usuários não volte a usar apenas o teclado.
O StarWhisper é um atalho de teclado em todo o sistema para Windows. A superfície de ditado é "qualquer campo de texto que tenha foco no momento". Isso significa que o mesmo fluxo que você usa para o ChatGPT funciona para:
Uma instalação, um atalho, todo campo de texto no SO recebe voz para texto. Essa é a razão prática pela qual os usuários regulares do ChatGPT o adotam para mais do que apenas o ChatGPT após alguns dias.
Mesmo atalho, superfícies diferentes.
Visão geral de todas as maneiras de usar voz no fluxo de trabalho do ChatGPT.
Escrita longa dentro do Docs usando o mesmo atalho.
Capturar notas, resumos de reuniões e páginas por voz no Notion.
Como os escritores usam a voz para rascunhar prompts de IA e posts completos.