Microsoft Teamsの標準の文字起こし機能を利用するには、Teams Premiumが必須で、月額ユーザーあたり$10かかります。回避策は、会議をローカルで録画し、その後、〜で文字起こしすることです。 StarWhisper ローカルで無料で実行できます。録画データはローカルに残り、文字起こしデータもローカルに保たれます。
Teams Premiumのサブスクリプションは不要、クラウドへのアップロードも不要、分単位の料金もかかりません。
Windows PCでTeams会議を開いてください。録画するには、主催者であるか、主催者から許可を得る必要があります。管理ポリシーによって録画が制限されている組織の場合、この手順が利用できないことがあります。その場合は、後述するディクテーションワークフローを代替としてご使用ください。
会議ツールバーの三点リーダー(その他のアクション)をクリックし、「録画開始」を選択します。Teamsは参加者全員に会議が録画されていることを通知します。録画には、すべての話者の混合音声と、アクティブな共有画面(ある場合)が記録されます。
録画はデフォルトでOneDrive(1対1の会議)またはSharePoint(チャネル会議)に保存されます。会議終了後、会議チャットを開いてください。録画はサムネイルとして表示され、ダウンロードオプションがあります。それをクリックすると、MP4がローカルのWindowsマシンに保存されます。
StarWhisperを開き、ダウンロードしたMP4ファイルを文字起こしエリアにドラッグ&ドロップしてください。StarWhisperが音声を取り出し、CPUまたはGPU上でWhisperをローカル実行します。一般的な60分の会議は、最新のPCでは通常2〜5分で文字起こしが完了し、CUDAパック経由のNVIDIA GPUアクセラレーションを使用するとさらに高速になります。
文字起こし内容を確認し、クリップボードにコピーしたり、TXTファイルとして保存したり、OneNote、Notion、またはWordの会議メモに貼り付けたりしてください。この文字起こしはすべての言語に対応しています。 96のWhisper言語 そのため、複数の言語が混ざった国際電話でも、適切な言語を選択すれば正しく文字起こしされます。
内蔵されている月額$10/ユーザーの追加料金と比較したコスト、プライバシー、柔軟性。
Teams Premiumは、既存のMicrosoft 365ライセンスに加えて、月額ユーザーあたり$10かかります。20名のチームの場合、文字起こしだけで年間$2,400になります。StarWhisperは、毎日500語まで無料で、無制限の場合は月額$10です。
ダウンロードしたMP4は、文字起こし中にPCから外れることはありません。WhisperはCPUまたはGPU上で実行され、文字起こし結果をローカルディスクに書き込みます。機密性の高い会議、NDA(秘密保持契約)の対象となる議論、および規制産業にとって重要です。
Microsoft 365プランが録画を許可している場合(ほとんどのBusinessおよびEnterpriseプランが対応)、このワークフローを使用できます。特別な文字起こしライセンスは必要なく、標準の録画権限以上の管理者によるオプトインも不要です。
Whisperは96言語に対応しており、English、German、Spanish、French、Italian、Portuguese、Dutch、Polish、Japanese、Chinese、Korean、Russian、Arabic、Turkishなど、さらに多くの言語で高い性能を発揮します。
このパターンは、ZoomとGoogle Meetの録画の両方で同様に機能します。ローカルのMP4またはM4Aファイルをダウンロードし、StarWhisperにドラッグ&ドロップするだけで文字起こしが完了します。すべての会議の文字起こしニーズに対応できる単一のツールです。
会議中にStarWhisperのホットキーを使用すると、OneNote、Notion、またはTeamsチャットパネルにリアルタイムでメモをディクテーションできます。会議中に解釈をキャプチャするため、タイピングよりも速いです。
Microsoftは、Teams Premiumを、Teams内で話者ラベルとAIサマリーを含むホスト型会議文字起こし機能を提供する月額ユーザーあたり$10の追加料金として販売しています。小規模なチームにとって、月額席あたり$10はすぐに積み重なってしまい、文字起こしが唯一必要なTeams Premium機能である場合、多くの組織はその費用を正当化できません。
代替案は、このページに記載されているワークフローです。Teamsの標準録画機能(ほとんどのMicrosoft 365 BusinessおよびEnterpriseプランに含まれています)を使用し、MP4をダウンロードして、〜を通して実行します。 StarWhisper トレードオフは現実のものであり、正直に伝える価値があります。MP4は単一の混合トラックであるため、話者ラベルは失われます。Teams Premiumが生成するAIサマリーも失われます。その代わりに得られるのは、月額$10(席あたり)ではなく、総額で無料から$10の文字起こしであり、会議音声をどこにもアップロードせずにローカルで実行でき、ZoomとGoogle Meetの録画の両方で同じように機能します。
会議の検索可能なテキスト記録が必要なほとんどのチームにとって、このトレードオフは価値があります。20名のチームの場合、年間2,000ドル以上のコスト削減となり、機密性の高い内容を扱う会議にとってはプライバシーの向上が非常に大きいです。
主催者であるか、録画の許可があることを確認してください。テナントのポリシーによって録画が完全にブロックされている場合、このアプローチは機能しません。その場合は、メモアプリへのライブディクテーションが実用的な代替案となります。
会議が始まったら録画を開始してください。オプションとして、StarWhisperのホットキーを使用して、OneNote、Notion、またはTeamsチャットパネルにライブメモをディクテーションできます。ライブディクテーションは解釈をリアルタイムでキャプチャするため、会議後の完全な文字起こしと組み合わせることで、両方の視点を得ることができます。
会議のチャットを開いてください。短い会議の場合、録画は1〜2分で表示され、長い会議ほど時間がかかります(TeamsはまずあなたのマシンからOneDriveまたはSharePointにアップロードします)。録画をクリックしてMP4としてダウンロードします。StarWhisperを開き、MP4をドラッグし、Whisperが処理するのを待ちます。一般的な60分の会議は、CPUのみの最新PCで2〜5分で文字起こしされ、NVIDIA GPUではさらに高速です。
プロジェクトフォルダにTXTファイルとして保存します。OneNote、Notion、またはConfluenceの会議メモページに貼り付けます。タスクトラッカーにアクションアイテムを抽出します。多くのユーザーは、この文字起こしをChatGPTやClaudeに「この会議を要約し、アクションアイテムを抽出し、人物ごとにグループ化してください」といったプロンプトと一緒に貼り付けます。
StarWhisperは会議の文字起こしストリームではなく、ディクテーションのホットキーです。しかし、このホットキーは、ご自身のメモ、Teamsチャットパネルでのコメント、および発生したアクションアイテムをキャプチャする際に、会議中に非常に役立ちます。ホットキーを押しながらメモを話し、離します。テキストはフォーカスが当たっているWindowsのテキストフィールドに表示されます。
Teams会議中に一般的に使用されるライブディクテーションの場所:
ライブディクテーションと会議後の文字起こしを組み合わせることで、ご自身の解釈(メモ)と逐語記録(文字起こし)の両方を得ることができ、単独で使うよりもはるかに有用です。
| アプローチ | 月額費用(単一ユーザー) | 月額費用(20ユーザーチーム) | 音声がデバイスを離れる | 話者ラベル |
|---|---|---|---|---|
| Teams Premium | $10/user | $200 | はい(Microsoftホスト) | はい |
| StarWhisper free plan | $0 | $0 | いいえ(ローカルモード) | いいえ |
| StarWhisper Pro | $10 flat | $10 flat (1 license) | いいえ(ローカルモード) | いいえ |
| Otter.ai Pro | $17 | $340 | はい(クラウド) | はい |
| Rev human transcription | $0.25/minute (variable) | 可変 | はい(クラウド) | はい(有料) |
話者ラベルが必須のチームの場合、Teams PremiumまたはOtter.aiが費用に見合う可能性があります。会議の音声をどこにもアップロードせず、検索可能なテキスト記録が必要なチームの場合、StarWhisperのワークフローは劇的に安価です。
これは、どの会議文字起こしアプローチにおいても重要な質問です。正直な内訳は以下の通りです。
NDA、HIPAA、GDPR、または弁護士-依頼人秘匿特権の対象となる会議の場合、Local Modeは文字起こしステップをデバイス内部に保ちます。これが、クラウドベースのサービスよりもこのアプローチを選択する際の決定的な要因となることがよくあります。
ワークフローは他の会議ツールでも同一です。ローカルで録画するか(またはプラットフォームのクラウド録画からダウンロードし)、ファイルをStarWhisperにドラッグし、文字起こしテキストを取得します。
すべてに対応する一つのツール。MP4または音声ファイルは、どの会議プラットフォームが生成したものかに関わらず、StarWhisperにとって単なるファイルです。