Spracherkennung (Speech to Text)

4 min read

Lade eine Audiodatei (Podcast, Videospur, Sprachnotiz) hoch und erhalte ein schriftliches Transkript. Die Funktion basiert auf dem Scribe-Modell von ElevenLabs. Verfügbar in den Pro- und Agency-Tarifen.

Wann du es nutzen solltest

  • Texttranskripte für Video- oder Podcast-Folgen erstellen (Barrierefreiheit + SEO)
  • Sprachmemos oder Diktate in Entwürfe umwandeln
  • Durchsuchbare Inhalte aus Interview-Aufnahmen generieren

Unterstützte Audioformate

  • MP3 (empfohlen)
  • WAV
  • M4A
  • FLAC
  • OGG

Dateien bis zu 500 MB. Bei längeren Inhalten in Abschnitte aufteilen und einzeln transkribieren.

Unterstützte Sprachen

ElevenLabs Scribe unterstützt mehr als 30 Sprachen, darunter Englisch, Spanisch, Französisch, Deutsch, Italienisch, Portugiesisch, Niederländisch, Polnisch, Russisch, Japanisch, Chinesisch, Arabisch und Norwegisch. Die Sprache wird auf der Speech-to-Text-Seite ausgewählt.

Eine Audiodatei transkribieren

  1. Gehe zu Tools → Speech to Text.
  2. Klicke auf Audiodatei hochladen oder füge eine URL zu einer vorhandenen Datei ein.
  3. Wähle die Sprache der Audiodatei.
  4. Klicke auf Transkribieren.
  5. Warte auf die Verarbeitung. Eine 30-minütige Datei dauert etwa 1-2 Minuten.
  6. Sobald bereit, erscheint das Transkript im Editor darunter.

Was du mit dem Transkript machen kannst

  • Kopieren des vollständigen Textes in die Zwischenablage
  • Herunterladen als .txt-Datei
  • Als Entwurf speichern - erstellt einen neuen WordPress-Entwurf mit dem Transkript als Inhalt
  • Bearbeiten direkt im Transkript-Editor vor dem Speichern

Wie Credits abgerechnet werden

Speech to Text verwendet ein separates Credit-Kontingent als Text-zu-Sprache. In den Pro- und Agency-Tarifen ist ein großzügiges Kontingent enthalten. Genaue Mengen werden auf der Speech-to-Text-Seite und in deinen Tarifdetails angezeigt.

Wenn du deinen eigenen ElevenLabs-Schlüssel mit aktivierter Speech-to-Text-Berechtigung hast, kann das Plugin diesen stattdessen verwenden.

Tipps für bessere Genauigkeit

  • Sauberes Audio verwenden (minimales Hintergrundrauschen) für beste Ergebnisse
  • Deutlich sprechen - überlappende Stimmen vermeiden
  • Kurze Pausen zwischen Sätzen verbessern die Interpunktionsgenauigkeit
  • Das Plugin trennt derzeit keine Sprecher (Einzelsprecher-Transkripte)

Einschränkungen

  • Jeweils eine Datei (keine Stapelverarbeitung in dieser Version)
  • Maximale Dateigröße 500 MB
  • Transkripte werden nicht automatisch gespeichert - kopieren, herunterladen oder als Entwurf speichern, bevor du die Seite verlässt

Verwandte Seiten