Skip to main content

Formate & Sprachen – präzise Transkripte, flexibel bereitgestellt

Eine detaillierte Übersicht über alle unterstützten Eingabe- und Exportformate sowie die 50+ Sprachen, die R2 Mechanics transkribiert – einschließlich Optionen für manuelle Nachbearbeitung, interaktive HTML-Ausgaben und Langzeitarchivierung im WARC-Format.

Zusätzliche Details

Das Web ARChive (WARC) Format ist ein international anerkanntes Standardformat für die langfristige Erhaltung digitaler Inhalte. Es bündelt Transkripte, Audio und Metadaten in einer einzigen, autarken Archivdatei.


Warum es wichtig ist;

Integrität: Stellt sicher, dass Ihre Daten über Jahrzehnte hinweg unverändert und überprüfbar bleiben.

Kompatibilität: Weit verbreitet bei Bibliotheken, Archiven und Forschungseinrichtungen.

Zukunftssicherheit: Gewährleistet die Zugänglichkeit, selbst wenn sich Dateiformate weiterentwickeln.

KI-Randnotizen sind KI-gestützte kontextuelle Anmerkungen, die direkt neben dem Transkript eingebettet werden. Abhängig von der Sprachstufe (Essential, Advanced, Expert-Level) können sie Folgendes enthalten:

  • Zusätzliche Kommentare oder Erläuterungen für ein besseres Verständnis.

  • Querverweise auf externe Quellen oder verwandte historische bzw. biografische Kontexte.

  • Beobachtungen zu Tonfall, narrativer Kohärenz und Inhaltsplausibilität für ein tieferes Verständnis.

In interaktiven HTML-Transkripten sind die Randnotizen per Hover oder Klick abrufbar und bieten den Leserinnen und Lesern einen reicheren, mehrschichtigen Kontext, der dem gewählten Analyse-Level entspricht.


 Audio-Restaurierung verbessert Aufnahmen von minderer Qualität vor der Transkription. Dies kann Folgendes umfassen:

  • Rauschunterdrückung zur Entfernung von Hintergrundrauschen oder statischen Störgeräuschen.

  • Lautstärkeanpassung für gleichmäßige Pegel über die gesamte Datei hinweg.

  • Equalizing (Klangentzerrung) zur Verbesserung von Klarheit und Verständlichkeit.
    Dieser Prozess gewährleistet maximale Transkriptionsgenauigkeit und liefert Ihnen eine restaurierte Audiodatei, die leichter anzuhören und zu archivieren ist.


Transkriptions-Pipeline – Vom Eingang bis zum Ergebnis

Flexible Ausgabeformate für jeden Anwendungsfall

R2 Mechanics liefert Transkripte in Formaten, die für Forschung, Archivierung und praktische Nutzung optimiert sind. Ob Sie ein sofort lesbares PDF, editierbaren Text oder ein vollständig interaktives HTML-Transkript mit Annotationen und Audiowiedergabe benötigen – unsere Pipeline garantiert maximale Flexibilität. Für Institutionen und Archive bieten wir zusätzlich WARC-Dateien – den international anerkannten Standard für die Langzeitarchivierung – sowie strukturierte JSON-, CSV- und RTTM-Metadaten zur präzisen Synchronisierung, Indexierung und Integration in Archivsysteme. Optional liefern wir auch restaurierte Audiofassungen mit erhöhter Verständlichkeit und barrierearmer Zugänglichkeit.

🎙️

Eingangsformate

  • 🎵Audio: WAV, MP3, FLAC, AAC, M4A, OGG
  • 🎥Video: MP4, MKV, MOV, AVI
  • 🎚️Mehrspur-Aufnahmen (Interviews, Panels, Podcasts)
⚙️

Verarbeitung

  • ⏱️WhisperX / Whisper v3 JSON (Timestamps & Sprechertrennung)
  • 🧩Pyannote-Diarisierung / RTTM- & TextGrid-Alignment
  • 📊CSV-Segmenttabellen & Sprecherstatistiken
  • 📝Side-Notes (Annotationen & kontextuelle Kommentare)
  • 💬Untertitel-Formate: VTT / SRT
  • 🎛️Audio-Restauration: Rauschunterdrückung, EQ, Pegelangleichung
📦

Ausgabeformate

  • 📄PDF – Formatiertes, lesefertiges Transkript
  • ✏️TXT / Markdown – Editierbarer Rohtext
  • 🗂️JSON – Mit Timestamps, Sprecher- & Entitätsdaten
  • 📑CSV – Segment- & Sprechertabellen für Analyse und Qualitätskontrolle
  • 📈RTTM / TextGrid – Standardisierte Diarisierungs-Alignments
  • 🎞️VTT / SRT – Für Untertitelung und Medienintegration
  • 🌐Interaktives HTML – Klickbare Timestamps, Audioplayer & Side-Notes
  • 📦WARC – Langzeitarchiv-Container mit Transkript, Audio, JSON & Metadaten für institutionelle Archivierung

Unterstützte Sprachen – Genauigkeit, Formate & kontextuelle Erweiterungen

R2 Mechanics transkribiert in über 50 Sprachen und bietet unterschiedliche Stufen der Genauigkeit, kontextuelle Anreicherung und archivtaugliche Ausgabeformate.

Premium-SprachenEnglisch, Deutsch, Französisch und Polnisch – erhalten eine manuelle Experten-Revision und KI-gestützte kontextuelle Annotationen. So verbinden wir sehr hohe Transkriptionsgenauigkeit mit fundierten historischen, biografischen und Plausibilitäts-Einblicken.

Alle übrigen unterstützten Sprachen werden mit derselben sicheren Offline-First-Pipeline verarbeitet, jedoch ohne manuelle Experten-Revision. Dies führt zu unterschiedlich tiefen Kontextinterpretationen, was sich in den Kategorien Hoch, Gut und Begrenzt in der Tabelle unten widerspiegelt.

▼ Sehr hohe Genauigkeit (Premium)

▼ Hohe Genauigkeit

▼ Gute Genauigkeit

▼ Begrenzte Genauigkeit (eingabeabhängig)