Whitepaper: Ferrum & GA4GH

Wie Synaptic Four eine einheitliche GA4GH-Infrastruktur aufgebaut hat—und was das über unsere technische Arbeitsweise zeigt.

März 2026 · Synaptic Four · Stuttgart, Deutschland

Kurz für Entscheider:innen

Lesehilfe für Führungskräfte

Kurzer Kontext in Alltagssprache. GA4GH in einem Satz. Kurz, wie Inklusion zu uns passt. Der Rest der Seite bleibt technisch vollständig.

Aufklappen Zuklappen

Das Dokument erklärt, warum wir Ferrum gebaut haben, wie die Architektur zusammenspielt, wie HelixTest validiert, und wie wir arbeiten—inkl. transparentem Einsatz von KI als Werkzeug.

  • Interne Sponsoring-Story: Motivation, Umfang und Grenzen (kleine Benchmark-Slices—keine überhöhten Versprechen).
  • Unterscheidung „technisches Signal“ vs. „offizielle Zertifizierung“—wichtig für Qualität und Recht.
  • Unser Betriebsmodell: Präzision, Reproduzierbarkeit und Inklusion gehören zur gleichen Firma—kein separates CSR-Folienpaket neben der Technik.
  • PDF zum Weitergeben; diese Webseite für Schnellorientierung und Repository-Links.

Was ist GA4GH?

Die Global Alliance for Genomics and Health (GA4GH) ist eine internationale Initiative, die gemeinsame technische Schnittstellen für genomische Daten und Analysen definiert. Partner schließen sich unter klaren Verträgen an, statt jede Verbindung einzeln neu zu bauen.

Synaptic Four verbindet sorgfältige Technik mit einem echten, gelebten Engagement für Neurodiversität und Inklusion von Menschen im Autismus-Spektrum. Das gehört zu unserer DNA—nicht als Marketing-Anhängsel neben der Technik. Mehr dazu: Über uns Autismus

Download (PDF)

Die ausführlichen PDFs können Sie für Druck, Archiv oder zum Weitergeben an Kolleg:innen herunterladen. Diese Seite ist eine kürzere Übersicht im Browser—mit Links zu den Repositories.

Kurzfassung

Ferrum implementiert einen breiten Satz von APIs der Global Alliance for Genomics and Health (GA4GH) in einer komponierbaren, on-premise-zentrierten Runtime. Dieses Whitepaper fasst Motivation, Architektur, Crypt4GH und Multi-Engine-Ausführung, Validierung mit der unabhängigen HelixTest-Suite und reproduzierbare Benchmarks über das Apache-2.0-Repo Ferrum GA4GH Demo zusammen. Es erläutert zudem, wie wir KI-gestützte Entwicklung transparent einsetzen—als Beschleunigung, nicht als Ersatz für technisches Urteil.

1. Ursprung und Motivation

Die Lücke

GA4GH definiert interoperable APIs für Daten und Rechnen (TES, WES, DRS, TRS, htsget, Beacon, Passports, Crypt4GH). In der Praxis werden oft nur Teilmengen umgesetzt; vollständige, querservice-fähige Stacks sind selten. Das Ökosystem profitiert von funktionierenden Implementierungen, die Standards gemeinsam in echten Pipelines ausprobieren.

Bestehende Arbeit

Es gibt starke Einzelkomponenten (z. B. TESK, Funnel, cwl-WES, WESkit, Teile des GA4GH Starter Kit, Galaxy-Integrationen). Ferrum zielt auf die Kombination TRS + DRS + WES + TES + htsget + Beacon + Passports + Crypt4GH in einer Runtime mit gemeinsamem Gateway, Auth und kontinuierlichen Cross-Service-Tests—nicht als Ersatz, sondern als fokussierter Integrationspunkt.

Warum wir es gebaut haben

Synaptic Four ist ein kleines Beratungsunternehmen. Statt auf einen Auftraggeber zu warten, der einen integrierten Stack bestellt, waren wir selbst erste Kundin: Ferrum ist Produkt und öffentlicher Nachweis unserer Arbeitsweise—präzise, dokumentiert und testgetrieben.

“Wir haben nach diesem integrierten Werkzeug gesucht. Wir haben es nicht gefunden. Also haben wir es gebaut—in der Sprache der GA4GH-Community.”

2. Was Ferrum ist

Dienste werden hinter einem Gateway (Rust, async) zusammengeführt. Metadaten in PostgreSQL; Objekte in S3-kompatiblem Speicher (MinIO, Cloud-S3, POSIX, OpenDAL-Backends wo zutreffend). Crypt4GH ist in der DRS-Schicht integriert, mit O(1)-Header-Re-Wrap für auslieferungsbezogene Schlüssel.

Deployment ist selektiv: nur die GA4GH-Dienste aktivieren, die Sie brauchen. Das Ferrum Lab Kit (BUSL) bietet eine opinionated On-Ramp für Labore, ELIXIR-Knoten-Kandidaten und GDI-nahe Szenarien—siehe Lab-Kit-Repository.

WES-Backends u. a. Cromwell (WDL), Nextflow, CWL und Snakemake über TES; SLURM und LSF für On-Premise-HPC.

3. Validierung und Benchmarks

End-to-End-Flows reichen von TRS-Workflow-Bezug über DRS bis WES/TES und optional Crypt4GH-Profilen—im Ferrum GA4GH Demo mit hap.py-Kennzahlen und DRS-Mikro-Benchmarks (Plain vs. at-rest). Der Umfang ist bewusst klein gehalten; wir behaupten nicht mehr, als wir messen.

4. HelixTest: Konformität in der CI

HelixTest ist eine Apache-2.0-Suite von Synaptic Four. Sie läuft bei jedem Ferrum-Push/PR gegen einen Live-Stack (Postgres, MinIO, Keycloak, Seed-Daten) und deckt API-Verträge, Workflow-E2E, Cross-Service-Ketten, Passports/OIDC-nahe Auth und Crypt4GH-orientierte Tests ab. Andere Plattformen können HelixTest wiederverwenden. Ergebnisse sind ein technisches Signal—keine offizielle GA4GH-Zertifizierung.

5. Wie Synaptic Four arbeitet

KI als Werkzeug, nicht als Abkürzung

Wir nutzen KI-gestützte Entwicklung für Gerüste, Spez-Navigation und repetitive, präzise Codierung—niemals als Ersatz für Architektur, Review oder Verantwortung. Korrektheit und Design bleiben beim Menschen.

“KI ist ein Werkzeug. Verantwortung für Korrektheit, Design und Folgen bleibt bei der technischen Person.”

Präzision und Transparenz

Öffentliche Benchmarks nennen Datenumfang, Wiederholungen und Grenzen. Reproduzierbarkeit zählt: Demo-Repos pinnen Versionen und erzeugen maschinenlesbare Artefakte.

Lizenzen im Überblick

Ferrum: BUSL-1.1 (siehe LICENSE und docs/BUSINESS-MODEL.md). HelixTest und Ferrum GA4GH Demo: Apache-2.0. Maßgeblich ist jeweils die LICENSE-Datei im Repository.

6. Fazit

Ein kleines Team kann eine GA4GH-orientierte Gesamtlösung liefern, wenn Standards, Tests und ehrlicher Scope gleichwertig behandelt werden. HelixTest und das GA4GH Demo machen das überprüfbar. Wir freuen uns über Kooperation, Deployment-Partnerschaften und Forschungskontakt.

Dieses Whitepaper darf zu nicht-kommerziellen Zwecken mit Namensnennung weitergegeben werden.

Repositories