Whitepaper: Ferrum & GA4GH
Wie Synaptic Four eine einheitliche GA4GH-Infrastruktur aufgebaut hat—und was das über unsere technische Arbeitsweise zeigt.
März 2026 · Synaptic Four · Stuttgart, Deutschland
Kurz für Entscheider:innen
Lesehilfe für Führungskräfte
Kurzer Kontext in Alltagssprache. GA4GH in einem Satz. Kurz, wie Inklusion zu uns passt. Der Rest der Seite bleibt technisch vollständig.
Aufklappen Zuklappen
Kurz für Entscheider:innen
Lesehilfe für Führungskräfte
Kurzer Kontext in Alltagssprache. GA4GH in einem Satz. Kurz, wie Inklusion zu uns passt. Der Rest der Seite bleibt technisch vollständig.
Das Dokument erklärt, warum wir Ferrum gebaut haben, wie die Architektur zusammenspielt, wie HelixTest validiert, und wie wir arbeiten—inkl. transparentem Einsatz von KI als Werkzeug.
- Interne Sponsoring-Story: Motivation, Umfang und Grenzen (kleine Benchmark-Slices—keine überhöhten Versprechen).
- Unterscheidung „technisches Signal“ vs. „offizielle Zertifizierung“—wichtig für Qualität und Recht.
- Unser Betriebsmodell: Präzision, Reproduzierbarkeit und Inklusion gehören zur gleichen Firma—kein separates CSR-Folienpaket neben der Technik.
- PDF zum Weitergeben; diese Webseite für Schnellorientierung und Repository-Links.
Was ist GA4GH?
Die Global Alliance for Genomics and Health (GA4GH) ist eine internationale Initiative, die gemeinsame technische Schnittstellen für genomische Daten und Analysen definiert. Partner schließen sich unter klaren Verträgen an, statt jede Verbindung einzeln neu zu bauen.
Synaptic Four verbindet sorgfältige Technik mit einem echten, gelebten Engagement für Neurodiversität und Inklusion von Menschen im Autismus-Spektrum. Das gehört zu unserer DNA—nicht als Marketing-Anhängsel neben der Technik. Mehr dazu: Über uns Autismus
Download (PDF)
Die ausführlichen PDFs können Sie für Druck, Archiv oder zum Weitergeben an Kolleg:innen herunterladen. Diese Seite ist eine kürzere Übersicht im Browser—mit Links zu den Repositories.
Kurzfassung
Ferrum implementiert einen breiten Satz von APIs der Global Alliance for Genomics and Health (GA4GH) in einer komponierbaren, on-premise-zentrierten Runtime. Dieses Whitepaper fasst Motivation, Architektur, Crypt4GH und Multi-Engine-Ausführung, Validierung mit der unabhängigen HelixTest-Suite und reproduzierbare Benchmarks über das Apache-2.0-Repo Ferrum GA4GH Demo zusammen. Es erläutert zudem, wie wir KI-gestützte Entwicklung transparent einsetzen—als Beschleunigung, nicht als Ersatz für technisches Urteil.
1. Ursprung und Motivation
Die Lücke
GA4GH definiert interoperable APIs für Daten und Rechnen (TES, WES, DRS, TRS, htsget, Beacon, Passports, Crypt4GH). In der Praxis werden oft nur Teilmengen umgesetzt; vollständige, querservice-fähige Stacks sind selten. Das Ökosystem profitiert von funktionierenden Implementierungen, die Standards gemeinsam in echten Pipelines ausprobieren.
Bestehende Arbeit
Es gibt starke Einzelkomponenten (z. B. TESK, Funnel, cwl-WES, WESkit, Teile des GA4GH Starter Kit, Galaxy-Integrationen). Ferrum zielt auf die Kombination TRS + DRS + WES + TES + htsget + Beacon + Passports + Crypt4GH in einer Runtime mit gemeinsamem Gateway, Auth und kontinuierlichen Cross-Service-Tests—nicht als Ersatz, sondern als fokussierter Integrationspunkt.
Warum wir es gebaut haben
Synaptic Four ist ein kleines Beratungsunternehmen. Statt auf einen Auftraggeber zu warten, der einen integrierten Stack bestellt, waren wir selbst erste Kundin: Ferrum ist Produkt und öffentlicher Nachweis unserer Arbeitsweise—präzise, dokumentiert und testgetrieben.
“Wir haben nach diesem integrierten Werkzeug gesucht. Wir haben es nicht gefunden. Also haben wir es gebaut—in der Sprache der GA4GH-Community.”
2. Was Ferrum ist
Dienste werden hinter einem Gateway (Rust, async) zusammengeführt. Metadaten in PostgreSQL; Objekte in S3-kompatiblem Speicher (MinIO, Cloud-S3, POSIX, OpenDAL-Backends wo zutreffend). Crypt4GH ist in der DRS-Schicht integriert, mit O(1)-Header-Re-Wrap für auslieferungsbezogene Schlüssel.
Deployment ist selektiv: nur die GA4GH-Dienste aktivieren, die Sie brauchen. Das Ferrum Lab Kit (BUSL) bietet eine opinionated On-Ramp für Labore, ELIXIR-Knoten-Kandidaten und GDI-nahe Szenarien—siehe Lab-Kit-Repository.
WES-Backends u. a. Cromwell (WDL), Nextflow, CWL und Snakemake über TES; SLURM und LSF für On-Premise-HPC.
3. Validierung und Benchmarks
End-to-End-Flows reichen von TRS-Workflow-Bezug über DRS bis WES/TES und optional Crypt4GH-Profilen—im Ferrum GA4GH Demo mit hap.py-Kennzahlen und DRS-Mikro-Benchmarks (Plain vs. at-rest). Der Umfang ist bewusst klein gehalten; wir behaupten nicht mehr, als wir messen.
4. HelixTest: Konformität in der CI
HelixTest ist eine Apache-2.0-Suite von Synaptic Four. Sie läuft bei jedem Ferrum-Push/PR gegen einen Live-Stack (Postgres, MinIO, Keycloak, Seed-Daten) und deckt API-Verträge, Workflow-E2E, Cross-Service-Ketten, Passports/OIDC-nahe Auth und Crypt4GH-orientierte Tests ab. Andere Plattformen können HelixTest wiederverwenden. Ergebnisse sind ein technisches Signal—keine offizielle GA4GH-Zertifizierung.
5. Wie Synaptic Four arbeitet
KI als Werkzeug, nicht als Abkürzung
Wir nutzen KI-gestützte Entwicklung für Gerüste, Spez-Navigation und repetitive, präzise Codierung—niemals als Ersatz für Architektur, Review oder Verantwortung. Korrektheit und Design bleiben beim Menschen.
“KI ist ein Werkzeug. Verantwortung für Korrektheit, Design und Folgen bleibt bei der technischen Person.”
Präzision und Transparenz
Öffentliche Benchmarks nennen Datenumfang, Wiederholungen und Grenzen. Reproduzierbarkeit zählt: Demo-Repos pinnen Versionen und erzeugen maschinenlesbare Artefakte.
Lizenzen im Überblick
Ferrum: BUSL-1.1 (siehe LICENSE und docs/BUSINESS-MODEL.md). HelixTest und Ferrum GA4GH Demo: Apache-2.0. Maßgeblich ist jeweils die LICENSE-Datei im Repository.
6. Fazit
Ein kleines Team kann eine GA4GH-orientierte Gesamtlösung liefern, wenn Standards, Tests und ehrlicher Scope gleichwertig behandelt werden. HelixTest und das GA4GH Demo machen das überprüfbar. Wir freuen uns über Kooperation, Deployment-Partnerschaften und Forschungskontakt.
Dieses Whitepaper darf zu nicht-kommerziellen Zwecken mit Namensnennung weitergegeben werden.