Skip to main content

Systemübersicht – R2 Mechanics

Diese Seite bietet eine umfassende technische Darstellung des R2 Mechanics Systems: von der modularen Offline-Architektur über GPU-gestützte Transkription bis hin zu auditierbaren Workflows und dokumentierten Export-Schnittstellen für Archive und Forschung.

Zugriffskontrolle & Governance

Projektbasierte Isolation mit rollenbasiertem Zugriff (Eigentümer / Bearbeiter / Leser) und optionaler 2FA / MFA-Authentifizierung. Keine Unterauftragsverarbeiter. Alle Übergaben werden protokolliert und zur Herkunftssicherung signiert.


Datenlebenszyklus & Aufbewahrung

Ein definierter Lebenszyklus steuert alle Materialien: Erfassung → Offline-Verarbeitung → Prüfung → Auslieferung → Aufbewahrung / Löschung. Aufbewahrungsfristen (30 / 60 / 90 Tage oder kundendefiniert) und sichere Löschung auf Anfrage gewährleisten die vollständige Einhaltung institutioneller Datenschutzrichtlinien.


Reproduzierbarkeit & Versionssicherung

Jeder Projektdurchlauf protokolliert die exakten Modellversionen (WhisperX large-v3, pyannote.audio 4.x), den CUDA/Torch-Stack, Konfigurations-Hashes und Zeitstempel in einem Laufprotokoll. Dadurch werden deterministische Wiederholungen und eine auditierbare Nachverfolgbarkeit gewährleistet.


Sicherheitsarchitektur

  • Vollständig isolierte („air-gapped“) Infrastruktur — keine Cloud-Dienste oder externen Auftragsverarbeiter.
  • Verschlüsselte Datenerfassung, isolierte Speicherung und strikte physische Zugriffskontrolle.
  • Offline, unveränderliche Backups und ein dokumentiertes Incident-Response-Protokoll.

Leistungsprofil

  • Dauerhafter 24/7-GPU-Betrieb mit konstantem Durchsatz für langformatige Audio- und Videodateien.
  • Typische Leistung: mehrstündige Aufnahmen werden pro GPU und Tag verarbeitet – mit deterministisch skalierbarer Laufzeit.
  • Sprecherreiche, mehrsprachige und rauschbehaftete Quellen werden durch adaptive VAD-Algorithmen und abgestimmte Diarisierungs-Schwellenwerte unterstützt.

Formate & Sprachen

Eingabeformate: WAV/BWF, FLAC, MP3, MP4/MKV/ProRes. Ausgabeformate: HTML, DOCX, Markdown (optional PDF oder WARC). Unterstützte Sprachen: Englisch (EN), Deutsch (DE), Französisch (FR) und Polnisch (PL); weitere auf Anfrage verfügbar.


Compliance

Die gesamte Verarbeitung erfolgt ausschließlich auf der Infrastruktur von R2 Mechanics innerhalb der Europäischen Union (Polen) – ohne Datenübertragungen an Dritte oder externe Cloud-Anbieter. Auftragsverarbeitungsverträge (AVV/DPA) sowie Technische und Organisatorische Maßnahmen (TOMs) sind für institutionelle Partner auf Anfrage erhältlich.


Release- & Change-Management

Quartalsweise Releases gewährleisten eine kontrollierte Weiterentwicklung des Systems. Jede Projektversion bleibt eingefroren, bis ein Upgrade ausdrücklich freigegeben wird – und sichert so vollständige Reproduzierbarkeit und kontinuierliche Auditierbarkeit.


Datenschutz & Transparenz

R2 Mechanics unterstützt vollständig offline arbeitende Workflows und kann unter einer Geheimhaltungsvereinbarung (NDA) für sensible oder unveröffentlichte Materialien betrieben werden. Alle Verarbeitungsschritte sind überprüfbar und auditbereit, während der operative Code aus Sicherheits- und Integritätsgründen vertraulich bleibt.


Projektressourcen & Downloads


Alle Downloads und Dokumentationen dienen der Transparenz und Nachvollziehbarkeit. Es werden keine personenbezogenen Daten über diese Seite erfasst oder verarbeitet.

Die R2-Mechanics Infrastruktur


R2 Mechanics basiert auf einer vollständig offline arbeitenden, modularen KI-Infrastruktur, entwickelt für Präzision, Transparenz und überprüfbare Datensouveränität. Jeder Verarbeitungsschritt — von der Nextcloud-Eingabe bis zum HTML-Export — läuft lokal, air-gapped und frei von Telemetrie.



Die aktuelle Architektur kombiniert WhisperX (large-v3), pyannote.audio (4.x) und eine lokale LLM-basierte Analyse (LM Studio / Ollama) innerhalb der r2_asr4-Umgebung — betrieben mit CUDA 12.x / Torch 2.4 für maximale GPU-Leistung, Reproduzierbarkeit und langfristige Stabilität über verschiedene Plattformen hinweg.



Unsere Technologie ist kein Produkt — sie ist das Rückgrat unseres Dienstes.

1. Datenerfassung & Validierung

Alle Projekte beginnen in einer sicheren Nextcloud-Umgebung. Integritätsprüfungen und Metadaten-Mappings verifizieren die Eingabedateien vor der Verarbeitung. Optional definieren Intake-Formulare die Projektparameter vorab und starten den Offline-Workflow automatisch nach verschlüsseltem Upload.



2. Lokale Verarbeitung & KI-Analyse

GPU-beschleunigte WhisperX (large-v3) und pyannote.audio (4.x) führen Transkription und Sprechertrennung durch, gefolgt von einer lokalen LLM-basierten semantischen Analyse für Themen, Entitäten, Zusammenfassungen und mehrsprachige Kontextebenen — alles innerhalb einer versionsgesicherten Umgebung, die vollständige Auditierbarkeit und deterministische Wiederholbarkeit gewährleistet.


3. Visualisierung & HTML-Rendering

Strukturierte, navigierbare Ausgaben (HTML, DOCX, Markdown) enthalten Zeitmarken, Sprecherlabels und kapitelbasierte Navigation. Optionale SDXL-Bilderzeugung bereichert Kapitel mit kontextuellen Visualisierungen — vollständig offline.


4. Audit & Langzeitarchivierung

Jeder Durchlauf erzeugt Zeitstempel-Logs, WARC-Standard-Archive und reproduzierbare Leistungsberichte — für institutionelle Nachvollziehbarkeit und langfristige Herkunftssicherung.


Energiearchitektur & Nachhaltigkeit

Jedes System ist energieautonom, betrieben mit erneuerbaren Energiequellen und USV-gepufferter Redundanz für den 24/7-Betrieb. Die Komponenten sind modular, vor Ort reparierbar und für eine Einsatzdauer von 10 Jahren ausgelegt.


Energiearchitektur & Nachhaltigkeit

Jedes System nutzt NVMe-Speicher auf Enterprise-Niveau für gleichbleibend hohen Durchsatz, geringe Latenz und maximale Zuverlässigkeit bei kontinuierlichen 24/7-Workloads. Betrieben mit erneuerbaren Energiequellen und USV-gepufferter Redundanz sind alle Komponenten modular, wartbar und für eine Lebensdauer von 10 Jahren konzipiert.

  • Hochgeschwindigkeits-NVMe-Architektur — keine I/O-Engpässe
  • Integration erneuerbarer Energien & keine Cloud-Abhängigkeit
  • Passiv- / Flüssigkeitsgekühlte GPU-Arrays für Dauerlast
  • Off-Grid-Puffer für Betriebs­kontinuität
  • Wartbare Hardware — gebaut für Langlebigkeit und Auditierbarkeit


Ingenieurspräzision, Energieunabhängigkeit und Datenethik — das Fundament von R2 Mechanics.