Zoom's integrierte Transkription erfordert den Business Plan zu 199 dollars pro Benutzer und Jahr. Lassen Sie es aus. Nehmen Sie lokal auf, ziehen Sie die .m4a in eine kostenlose Windows-App und erhalten Sie das vollständige Transkript in Minuten.
Funktioniert mit jedem Zoom-Tier, einschließlich des kostenlosen Plans.
Öffnen Sie Zoom, gehen Sie zu Einstellungen, Aufnahme und aktivieren Sie die lokale Aufnahme. Wählen Sie einen Ordner, den Sie später wiederfinden können (Standard ist Dokumente, Zoom). Die lokale Aufnahme steht kostenlosen Zoom-Nutzern zur Verfügung, solange Sie der Gastgeber des Meetings sind. Wenn Sie nicht der Gastgeber sind, bitten Sie den Gastgeber, sich selbst aufzuzeichnen oder Ihnen die Aufnahmeprivilegien zu erteilen.
Klicken Sie während des Anrufs in der Zoom-Symbolleiste auf Aufnahme (oder drücken Sie Alt+R) und wählen Sie Aufnahme auf diesem Computer, falls Sie sowohl lokale als auch Cloud-Optionen haben. Zoom zeigt eine kleine Aufnahmeanzeige in der Ecke an, damit alle Bescheid wissen. Wenn der Anruf endet, verlassen Sie das Meeting normal. Zoom benötigt ein bis zwei Minuten, um die Aufnahme in endgültige Dateien umzuwandeln.
Öffnen Sie den Datei-Explorer und navigieren Sie zu Dokumente, Zoom. Im Inneren sehen Sie einen datierten Unterordner für jede Aufnahme. Öffnen Sie den neuesten. Sie finden audio_only.m4a (das Anruf-Audio, die kleinere Datei) und zoom_0.mp4 (das Bildschirm-Sharing-Video). Für die Transkription benötigen Sie nur die Audiodatei. Die Videodatei funktioniert auch, falls Sie es vorziehen; StarWhisper extrahiert das Audio automatisch aus .mp4.
Installieren StarWhisper falls Sie es noch nicht getan haben. Öffnen Sie die App und ziehen Sie audio_only.m4a aus dem Datei-Explorer auf das Fenster. Die App erkennt die Sprache und beginnt mit der Transkription. Ein einstündiges Gespräch wird typischerweise auf einer modernen CPU in 5 bis 15 Minuten oder auf einer NVIDIA GPU in 1 bis 3 Minuten verarbeitet. Der Fortschritt wird in Echtzeit angezeigt. Sie können die App im Hintergrund laufen lassen.
Das Transkript erscheint im StarWhisper Fenster. Lesen Sie es durch, kopieren Sie den vollständigen Text in die Zwischenablage oder speichern Sie ihn als .txt Datei. Fügen Sie ihn in Notion, OneNote, Google Docs oder Ihr Meeting-Notizsystem ein. Das Transkript ist reiner Text ohne Sprecherbezeichnungen, was die Datei portabel und einfach zu bearbeiten macht. Gesamtkosten: null. Kein Upload, kein Zoom Business Upgrade, keine Minutengebühren.
Ein kostenloser Workflow, der das tut, was der 199 dollar Plan leistet.
Zoom Business kostet rund 199 dollars pro Benutzer und Jahr. Dieser Workflow bleibt im kostenlosen Zoom-Tier und nutzt die kostenlose lokale Transkription von StarWhisper. Die jährlichen Einsparungen summieren sich schnell für Einzelnutzer oder kleine Teams.
Sowohl die lokale Zoom-Aufnahme als auch die StarWhisper-Transkription bleiben auf Ihrer Festplatte. Kein Upload zu Zoom-Servern für die Transkription, kein Drittanbieter-Meeting-Bot, der dem Anruf beitritt.
Der gleiche Workflow funktioniert für Microsoft Teams, Google Meet, Webex, Slack Huddles oder jeden anderen lokal aufgezeichneten Anruf. Die Audiodatei ist das Einzige, was zählt.
Arbeiten Sie mit einem Team in Berlin, Tokio und Sao Paulo? Whisper erkennt automatisch die Sprache jeder Aufnahme. Details zur Mehrsprachigkeit.
Die gleiche Installation ermöglicht es Ihnen auch, per Sprache direkt in den Zoom-Chat (oder jedes andere Textfeld) zu diktieren. Sehen Sie sich die Anleitung für die Sprach-zu-Text-Funktion in Zoom an die Anleitung für den gedrückt-und-gehaltenen Workflow. GPU-Beschleunigung
GPU-Details Das Preisschema von Zoom's integrierter Transkription.
Auch die offizielle Zoom-Transkription hat Einschränkungen, die die Leute zum ersten Mal überraschen. Das Audio wird in Zoom's Cloud verarbeitet, sodass es Ihr Netzwerk verlässt. Aufnahmen werden auf Zoom's Servern gespeichert und unterliegen den Aufbewahrungsrichtlinien von Zoom. Und es ist spezifisch auf Zoom-Anrufe beschränkt: Es kann kein aufgezeichnetes Microsoft Teams-Meeting oder ein Podcast-Interview transkribieren, das Sie an einem anderen Ort durchgeführt haben.
Diese Anleitung beschreibt die Alternative, die die meisten Leute letztendlich verwenden. Behalten Sie das kostenlose Zoom-Tier bei, nutzen Sie die integrierte lokale Aufnahme (die kostenlos ist) und verarbeiten Sie die resultierende Datei mit
StarWhisper auf Ihrem Windows PC. Gesamtkosten: null. Gesamte jährliche Einsparung gegenüber Zoom Business: 199 dollars pro Sitzplatz. Was Zoom Local Recording tatsächlich erfasst
Was Sie nicht standardmäßig erhalten, ist die Audioaufnahme pro Sprecher. Die Aufnahme ist ein einziger gemischter Track. Das bedeutet, dass StarWhisper ein kontinuierliches Transkript ohne Sprecherbezeichnungen erstellen wird. Für die meisten Anwendungsfälle von Aktionspunkten und Entscheidungen ist das in Ordnung: Es ist schnell zu lesen und rekonstruiert, wer was gesagt hat, wenn Sie sich an die Diskussion erinnern. Wenn die Sprecher-Diarisierung für Ihren Workflow entscheidend ist, benötigen Sie einen kostenpflichtigen Cloud-Transkriptionsdienst oder eine fortgeschrittenere lokale Einrichtung. Ehrliche Offenlegung.
Zoom zeichnet auch Ihren Bildschirm-Text auf. Das Transkript deckt nur gesprochenes Audio ab, nicht Text auf dem Bildschirm. Wenn jemand ein Dokument mit wichtigen Informationen geteilt hat, speichern Sie dieses Dokument separat.
Schritt-für-Schritt-Zoom-Aufzeichnungseinstellungen
Öffnen Sie Zoom (Desktop-Client). Klicken Sie auf Ihr Profilbild oben rechts und dann auf Einstellungen.
Geschwindigkeits- und Hardware-Erwartungen
Hardware
| 30-Minuten-Meeting | 60-Minuten-Meeting | 2-Stunden-Meeting | Moderner Laptop-CPU (i7 oder Ryzen 7) |
|---|---|---|---|
| 3 bis 6 Min | 6 bis 12 Min | 12 bis 25 Min | NVIDIA RTX 3060 (CUDA) |
| 30 bis 60 Sek | 1 bis 2 Min | 2 bis 5 Min | NVIDIA RTX 4090 (CUDA) |
| 10 bis 20 Sek | 20 bis 40 Sek | 1 bis 2 Min | Ältere CPU (5+ Jahre) |
| 10 bis 20 Min | 10 to 20 min | 25 bis 45 Min | 50 bis 90 Min |
Für die meisten Büro-Laptops, die in den letzten drei Jahren gekauft wurden, rechnen Sie damit, dass eine einstündige Besprechung in 6 bis 12 Minuten transkribiert wird. Das ist schneller, als die Besprechung bei 2x Geschwindigkeit erneut anzuhören. Wenn Sie viel Meeting-Transkription durchführen und eine NVIDIA GPU zur Hand haben, reduziert die Aktivierung des CUDA Packs die Zeit um eine Größenordnung.
Ein separater Anwendungsfall, der erwähnt werden muss. Über die Transkription aufgezeichneter Besprechungen hinaus ist das Hauptmerkmal von StarWhisper das gedrückte und gehaltene Sprach-Diktat in jedes Textfeld. Während eines Zoom-Anrufs können Sie es verwenden, um per Sprache in den Zoom Chat zu tippen, ohne den Blickkontakt mit Ihrer Kamera zu verlieren.
Der Workflow: Klicken Sie in das Zoom-Chat-Eingabfeld, halten Sie die StarWhisper-Hotkey-Taste (Standard ist Right Alt), sprechen Sie die Nachricht und lassen Sie los. Ihre Sprache wird zu getipptem Text. Dies ist nützlich, um während des Screen-Sharings detaillierte Nachrichten an Teilnehmer zu senden, schnelle Notizen während eines Anrufs zu erfassen, ohne auf eine Notizen-App wechseln zu müssen, oder einen offenen Chat-Thread parallel zum mündlichen Gespräch zu führen.
Für den vollständigen Echtzeit-Diktat-Workflow mit Zoom sehen Sie den dedizierten voice-to-text in Zoom Guide. Die Transkriptions-Engine ist dieselbe; nur der Auslöser ist anders.
Dieser Workflow speichert das Meeting-Audio und das Transkript auf Ihrem Gerät. Die lokale Zoom-Aufzeichnung wird auf Ihrer Festplatte gespeichert. StarWhisper Local Mode verarbeitet es lokal. Das resultierende Transkript ist eine .txt-Datei auf Ihrem PC. Keines davon verlässt Ihr Netzwerk, es sei denn, Sie entscheiden, es zu teilen (in ein Cloud-Dokument einzufügen, per E-Mail zu versenden, hochzuladen).
Vergleich mit Alternativen. Otter.ai tritt als Bot in Ihr Meeting ein und lädt das Audio auf die Server von Otter hoch. Notta macht dasselbe. Sogar die eigene Transkription von Zoom verarbeitet das Audio in der Cloud von Zoom. Für vertrauliche Anrufe (M&A-Diskussionen, Leistungsbeurteilungen, Kundeninterviews unter NDA) ist der rein lokale Workflow eine sinnvolle Verbesserung. Die privacy and offline architecture page behandelt die vollständige Datenflussanalyse.
Wenn Sie in einer regulierten Branche tätig sind (Gesundheitswesen, Recht, Finanzdienstleistungen), unterstützt die gleiche Architektur Ihre Compliance-Anforderungen. Die HIPAA compliance FAQ erläutert, was lokale Verarbeitung speziell für geschützte Gesundheitsinformationen bedeutet.
Vertriebsmitarbeiter, die Discovery Calls durchführen, Recruiter, die Screenings durchführen, und Account Manager, die Verlängerungen durchführen, profitieren alle von Transkripten aufgezeichneter Anrufe. Der Workflow ist hier derselbe: lokal aufzeichnen, anschließend transkribieren. Wenn Sie einen tieferen Einblick wünschen, wie Vertriebsteams und HR-Funktionen lokale Transkription nutzen, sehen Sie sich die rollenspezifischen Seiten an. Die voice-to-text for HR managers Guide behandelt Workflows für die Kandidatenscreening. Die voice-to-text for content creators Seite behandelt Podcast- und Interview-Workflows, die stark mit der Transkription von Verkaufsgesprächen überlappen.
Diktieren Sie per Sprache direkt in den Zoom Chat während eines Live-Anrufs.
Derselbe lokale Aufzeichnungs-Workflow für Teams-Anrufe und Teams-Transkripte.
Google Meet Sitzungsaufzeichnungen in Drive in durchsuchbaren Text umwandeln.
Kandidatenscreening-Transkripte und vertrauliche Interview-Notizen.