Ferrum — GA4GH-Infrastruktur die tatsächlich läuft.

Vollständiger GA4GH-Stack on-premise — für Kliniken, DIZ und genomDE-Datenknoten die ihre Rohdaten nicht in die Cloud schicken können. Getestet, dokumentiert, in Rust.

In Rust gebaut On-Premise BUSL-1.1

Nachprüfbare Substanz

Fünf öffentliche Repositories bilden den GA4GH-Stack: Ferrum (Daten/Compute), ga4gh-infra (Identity), Lab Kit (Deploy), Demo (Benchmark) und HelixTest (Konformität). Apache-2.0 wo angegeben; BUSL-1.1 für die integrierte Ferrum-Runtime mit klarer Forschungsfreistellung und vierjährigem Wechsel zu Apache-2.0 (siehe LICENSE).

Warum Ferrum existiert

Die meisten GA4GH-Implementierungen sind cloud-first, schwer prüfbar, oder schlicht nicht fertig. Ferrum ist für Teams gebaut die wissen dass ihre Daten on-premise bleiben müssen — und trotzdem mit GA4GH-kompatiblen Netzwerken interoperieren wollen. Die GA4GH-APIs sind gut. Es sollte ein System geben das sie konsequent umsetzt. Also haben wir es gebaut.

Für ressourcenarme Umgebungen konzipiert

Ferrum ist nicht nur für europäische Institutionen mit stabiler Infrastruktur gebaut. Eine wachsende Gruppe von Anwendern arbeitet in Umgebungen mit intermittierender Konnektivität, eingeschränkter Hardware, und dem Bedarf an souveräner Dateninfrastruktur fernab von Cloud-Abhängigkeiten. Ferrum läuft im Laptop-Modus auf einem einzelnen Gerät, überbrückt Stromausfälle mit Checkpoint-Recovery, und unterstützt Nanopore-Daten direkt aus dem Labor.

Funktionen

Funktion Beschreibung
Offline-First / Laptop-Modus Läuft auf einem Laptop mit SQLite und lokalem Speicher. Kein PostgreSQL, kein MinIO nötig. Erholt sich sauber nach Stromausfällen.
Nanopore / ONT-Integration Native Aufnahme von POD5/FAST5/BLOW5-Dateien. Speichert ONT-Qualitätsmetriken (Q-Score, N50) neben GA4GH-DRS-Objekten.
Multi-Pathogen-Beacon Beacon-v2-Abfragen über TB, Malaria, AMR und virale Erreger — auf derselben Infrastruktur wie humane Genomikdaten.
Outbreak-Modus Kontrollierte Notfall-Datenteilung: vorkonfigurierte Policies, die autorisierten Public-Health-Beacon-Zugriff während eines Ausbruchs gewähren — mit vollständigem Audit-Trail. Nicht offen, nicht geschlossen — kontrolliert.
Föderierter Beacon (P2P) Ferrum-Instanzen fragen einander direkt ab — kein zentraler Koordinator, keine Cloud-Abhängigkeit. Funktioniert über langsame oder intermittierende Verbindungen.
Batterie- / Solar-bewusst Erkennt Stromquelle (Netz/Batterie/UPS). Reduziert Last im Batteriebetrieb, schreibt Checkpoint vor Notabschaltung.
Data-Residency-Audit Kryptographisch verkettetes, append-only Log aller Datenbewegungen. Belegt, dass Daten in Ihrer Institution geblieben sind.

Was wir ehrlich sagen müssen

Ferrum ist getestet — HelixTest läuft in CI, die GA4GH Demo ist reproduzierbar, die Architektur ist so geschrieben dass sie skaliert. Was wir noch nicht haben: einen Einsatz mit wirklich großen klinischen Datenmengen. Das liegt nicht an der Architektur — es liegt daran dass wir die Ressourcen dafür noch nicht hatten. Das ist etwas das wir mit dem ersten richtigen Partner machen wollen.

Wir suchen einen ersten produktiven Pilot

Ferrum ist getestet und dokumentiert — aber ein Einsatz mit echten klinischen Datenmengen, z.B. an einem DIZ-Standort oder genomDE-Datenknoten, hat noch nicht stattgefunden. Das ist etwas das wir mit dem richtigen Partner gemeinsam machen wollen. Wer das richtige Team ist: eine Einrichtung die GA4GH-konform werden will, on-premise, ohne Cloud-Zwang — und die Offenheit mitbringt für eine echte Zusammenarbeit statt einen klassischen Software-Kauf.

Ferrum + GHGA — zwei Seiten einer Infrastruktur

GHGA ist das nationale Archiv für Genomdaten. Ferrum ist die lokale Seite: GA4GH-konforme Infrastruktur an der Klinik oder dem Datenknoten, bevor Daten zu GHGA übermittelt werden. Crypt4GH ist in Ferrum implementiert — dieselbe Verschlüsselung die GHGA verwendet. DRS-Schnittstelle für den Datentransfer. Keine Cloud als Zwischenschritt.

Crypt4GH DRS-kompatibel Kein Cloud-Zwischenschritt GHGA-komplementär

MII Kerndatensatz Integration

Ferrum MII Connect prüft FHIR-Profile gegen den MII-Kerndatensatz offline — ohne externe API-Abhängigkeit. JSON/SARIF Reports für ETL-CI. Für DIZ-Standorte die MII-Konformität in ihre Pipeline-CI einbauen wollen.

MII Connect Dokumentation →

GA4GH Services

TRS · DRS · WES · TES · htsget · Beacon v2 · Passports — alle unter einem Gateway, mit gemeinsamer Authentifizierung.

GA4GH-Implementierung auf GitHub →

Deployment-Optionen

Demo, Single Node, HPC Cluster, Kubernetes — alle Optionen sind dokumentiert.

Option Beschreibung
Demo Docker-Stack für Evaluation und Konformitätstests (HelixTest, GA4GH-Demo).
Single Node PostgreSQL und MinIO auf einem Server — Standard-Layout für produktive On-Premise-Deployments.
HPC Cluster SLURM/LSF-Integration für Workflow-Ausführung in Cluster-Umgebungen.
Kubernetes Kubernetes-Manifeste und Helm-Charts für skalierbare Cluster-Deployments.
Laptop / Offline Keine externen Abhängigkeiten. SQLite und lokales Dateisystem. Geeignet für Feldlabore und ressourcenarme Umgebungen. Feld- & Offline-Betrieb →
Deployment-Dokumentation auf GitHub →

Installation

Quickstart auf GitHub →

Lizenz & Zusammenarbeit

Ferrum ist unter BUSL-1.1 lizenziert — kostenlos für Forschung und nicht-kommerzielle Nutzung, mit kommerzieller Lizenz für produktive Deployments. Nach vier Jahren wechselt die Lizenz zu Apache-2.0. Du kannst es lizenzieren, Features anfragen, oder als Ausgangspunkt für deine eigene Infrastruktur nutzen. Kein Vendor Lock-in.

Konzipiert für regulierte Umgebungen (GDPR, EHDS, NIS2, HIPAA als Orientierung). Enthält technische Konformitätswerkzeuge (MII-Profilprüfung, CI-Reports). Kein Zertifizierungsversprechen — technische Evidenz, keine Rechtsberatung.

Zum Whitepaper Ferrum & GA4GH — HelixTest-Konformitätstests, GA4GH-Demo-Benchmarks, Architektur und unsere Arbeitsweise.

Regulatorischer Kontext: EHDS · NIS2 · DSGVO & Gesundheitsdaten

Wir antworten in der Regel innerhalb von zwei Werktagen. Auf Wunsch schicken wir Repository- und Lizenzdetails vorab.