どのブラウザまたはデスクトップアプリからでも、ChatGPTの入力ボックスに500語のプロンプトを直接話すだけで入力できます。 StarWhisper は、Windows向けのローカルファーストの音声テキスト変換ホットキーで、ChatGPT、Claude、Gemini、Perplexity、Cursor、およびあらゆるテキストフィールドで動作します。
インストールからChatGPTへの音声入力まで、5分以内で完了します。
ダウンロード StarWhisper starwhisper.aiまたは Microsoft Store. インストールには約1分かかります。初回起動時には、マイクへのアクセスを許可してください。無料プランでは1日あたり500語がカバーされ、これは複数の長いプロンプトには十分な量です。
Chrome、Edge、Firefox、Brave、または任意のブラウザでchatgpt.comに移動してください。または、Windows用の公式ChatGPTデスクトップアプリを開いてください。音声入力のフローはどちらも同じです。新しい会話を開始するか、既存の会話を続行してください。
会話の最下部にあるメッセージテキスト入力欄にカーソルを配置してください。これは「何か質問する」などとラベル付けされたフィールドです。StarWhisperは、現在フォーカスが当たっているWindowsのテキストコントロールに文字を入力するため、開始する前にカーソルを正しい位置に置いておく必要があります。
グローバルな音声入力ホットキーを押しながら長押しします。デフォルト設定がほとんどの環境で機能しますが、別のものが好みであれば設定で再割り当てが可能です。StarWhisperのアイコンは録音状態を表示するため、話す前にマイクがライブであることを確認できます。
プロンプト全体を、自然に話すペースで音声入力してください。長い指示、コンテキスト、例、制約、要求される出力形式など、すべてを含めます。文の終わりで一時停止してください。Whisperが句読点を自動で処理します。以下のいずれの言語でも話すことができます。 96の対応言語.
ホットキーを離すと、StarWhisperがローカルで文字起こしを行い、その結果をChatGPTの入力ボックスに貼り付けます。内容を読み返し、Whisperが誤認識した単語を修正し、必要であれば補足を加えてから、Sendを押してください。プロンプトは、あなたがSendを押したときにのみOpenAIに届き、まるで手入力したかのように正確です。
長い、構造化されたプロンプトを書くユーザーにとっての具体的な利点。
プロンプトは入力ボックス内のテキストとして届くため、送信する前に読み返し、再構築したり、箇条書きを追加したり、コードを貼り付けたり、洗練させたりすることができます。音声モードは、話し終わった瞬間に確定してしまいます。
ChatGPT、Claude、Gemini、Perplexity、Mistral、You.com、Poe、OpenRouterチャット、あらゆるブラウザベースのAIは、音声入力されたテキストを同様に受け取ります。Cursor、VS Code、JetBrains、Slack、Discord、Notion、Word、Gmailでも同様です。
ホットキーを長押しし、自分のペースで音声入力し、完了したら離すだけです。例や指示を含む複数段落のプロンプトが完全に届きます。音声モードの会話ウィンドウ内に留まる必要も、ChatGPTに途中で遮られる心配もありません。
音声はPC上でWhisperがローカルで動作することで処理されます。あなたの音声は、ChatGPTに届く前に、いかなるサードパーティの文字起こしサービスにもアップロードされません。テキストは、あなたがSendを押すことを決めたときにのみOpenAIに送信されます。
無料プランの1日あたり500語は、1日の複数の長いプロンプトをカバーします。Proは月額$10、または年額$80で、ChatGPTだけでなく、日々のすべてのライティングにおける無制限の音声入力が可能です。
母国語でプロンプトを音声入力し、ChatGPTに希望の言語で応答するように依頼できます。コンテンツクリエイター、翻訳者、そして思考が言語によって異なる人にとって非常に役立ちます。
ChatGPTを長く使うほど、プロンプトは長くなります。カジュアルなユーザーは「この記事を要約してください」と書きます。一方、パワーユーザーは、役割の割り当て、コンテキスト、良い出力と悪い出力の例、制約、ターゲット形式、および処理すべきエッジケースのリストを含む複数段落のブリーフを書きます。そのプロンプトは300語から800語にもなります。これをタイプするのに5分から15分かかりますが、話すだけで1分から3分で済みます。
速度の差は、実際に考える以上に重要です。プロンプトの質は、ChatGPTの出力品質における最大の変数です。長いプロンプトをタイプするのは時間がかかると感じると、手抜きをしたり、コンテキストを省略したり、応答を導くはずの例を飛ばしたりしがちです。一方、音声入力は速いため、すべてを含めることができます。モデルはより良いブリーフを受け取り、出力が向上し、やり取りの回数が短くなります。 StarWhisper このサイクルを迅速に行うために設計されています。
音声入力は、繰り返しの作業においても疲れにくいという利点があります。ChatGPTを一日中利用する人、コンテンツマーケター、コピーライター、開発者、創業者、サポートエンジニア、ワークフローを自動化するオペレーション担当者など、誰もがプロンプトをタイプすることによる累積的な手首への負担が積み重なることを知っています。入力に音声に切り替えることで、その負担を約半分に減らすことができます。
OpenAIはChatGPT独自の音声モードを持っています。これは異なるユースケースにとって素晴らしい製品です。両者を明確に比較することが重要です。
| 機能 | ChatGPTの音声モード | ChatGPTへのStarWhisper音声入力 |
|---|---|---|
| 最適 | 会話形式のやり取り | 長い構造化プロンプト、送信前の編集が可能 |
| 得られる出力 | 音声セッションでの音声またはテキストの返信 | 洗練できるプロンプトボックス内のテキスト |
| Claude/Gemini/Perplexityに対応 | いいえ | はい、同じフロー |
| Cursor、VS Code、Word、Notionで動作 | いいえ | はい、あらゆるテキストフィールドで動作 |
| 音声処理 | OpenAIにストリーミング送信 | デフォルトのローカルモードでローカル処理 |
| サブスクリプション | ChatGPT PlusまたはTeamが必要です | 無料プランは日々の音声入力をカバー。Proは月額$10、または年額$80で、ChatGPTだけでなく、日々のすべてのライティングにおける無制限の音声入力が可能です。 |
| 対応言語 | 対応セットは小さいです | Whisper経由で96言語 |
音声モードは、ChatGPTと人間のようにチャットしたい場合に最適です。プロンプトボックスへの音声入力は、慎重で詳細なブリーフを書き、編集し、それから送信したい場合に優れています。
1,500語の記事のブリーフを音声入力します。アングル、ターゲットオーディエンス、3つのサブトピック、コールトゥアクション、ブランドボイスのメモを話します。音声入力したブリーフを編集し、ChatGPTに送信して下書きを得ます。アウトラインや書き直しについても繰り返します。詳細については、こちらをご覧ください。 コンテンツクリエイター向け音声テキスト変換.
リファクタリングの説明を平易な英語で音声入力し、既存のコードを貼り付け、ChatGPTまたはClaudeに変更を依頼します。または、テストケースを自然言語の説明として音声入力することもできます。CursorとVS Codeの両方で同様に機能します。これらはどちらもStarWhisperへの単なるテキスト入力です。 Cursor VS Code
通常は要約するであろう関連するコンテキスト、情報源、制約をすべて含んだ長い質問を音声入力します。モデルが最初から完全なブリーフを受け取るため、より根拠のある回答が得られます。
散歩中や通勤中に戦略的なプロンプトを音声入力します(Windowsでヘッドセットマイクを使用)。デスクに戻ってから編集し、送信します。これが2026年における多くの戦略作業の進め方です。
これは頻繁に寄せられる、非常に合理的なご質問です。StarWhisper Local Modeは、お使いのCPUまたはGPUでWhisperを動作させます。音声はマイクでキャプチャされ、デバイスのメモリ内で処理され、ネットワーク呼び出しなしでテキストに変換されます。文字起こし中にどこにもデータがアップロードされることはありません。StarWhisperがChatGPTの入力ボックスに渡すテキストは、お客様が手動で入力されたテキストと全く同じものです。
その後、ChatGPTでSendを押した場合、お客様のテキストプロンプトはOpenAIのサーバーに届きますが、これは手動で入力するのと変わりありません。もしお客様の懸念がOpenAIがプロンプトの内容を見るかどうかということであれば、ディクテーションはそれを変えません。もしお客様の懸念がサードパーティの文字起こしサービスが生の音声データを受け取るかどうかということであれば、Local Modeがそれを完全に解決します。
オプトイン(任意選択)の機能があります。 Cloud Mode ハードな音声データで最大限の精度を求める場合に使用できます。OpenAI Whisper APIを使用します。予期せず有効になることは決してなく、選択肢はStarWhisperのUIで確認でき、もしそれがご希望であれば、永久にLocal Modeを維持することも可能です。
数回のセッションを重ねるうちに、ワークフローが自然になり、タイピングと比較して得られる速度の向上が大きいため、ほとんどのユーザーはキーボードのみのプロンプトに戻ることはありません。
StarWhisperはWindows用のシステム全体にホットキーを設定します。ディクテーションの対象は「現在フォーカスが当たっている任意のテキストフィールド」です。つまり、ChatGPTで使用するのと同じフローが、以下の場所でも機能します:
一度のインストール、一つのホットキーで、OS上のすべてのテキスト入力が音声入力に対応します。これが、通常のChatGPTユーザーが数日経つとChatGPTのためだけでなく、より広範囲で採用する実用的な理由です。