Livre blanc : Ferrum et GA4GH

Comment Synaptic Four a construit une infrastructure GA4GH unifiée — et ce que cela montre sur notre pratique d’ingénierie.

Mars 2026 · Synaptic Four · Stuttgart, Allemagne

Pour les décideurs et décideuses

Guide de lecture pour la direction

Contexte court et clair. GA4GH en une phrase. Comment l’inclusion nous concerne. Le reste de la page garde la profondeur technique.

Développer Réduire

Ce document explique pourquoi nous avons construit Ferrum, comment l’architecture s’articule, comment HelixTest le valide, et comment nous travaillons — y compris l’usage transparent de l’IA comme outil.

  • Un récit défendable pour les sponsors internes : motivation, périmètre et limites (petites tranches de benchmark — pas de revendications gonflées).
  • Il sépare « signal technique » et « certification officielle » — langage important pour la qualité et le juridique.
  • Il montre notre modèle d’exploitation : précision, reproductibilité et inclusion comme partie de la même entreprise — pas une diapositive RSE séparée de l’ingénierie.
  • Partagez le PDF comme support ; utilisez cette page pour une orientation rapide et des liens vivants vers les dépôts.

Qu’est-ce que GA4GH ?

Le Global Alliance for Genomics and Health (GA4GH) est une initiative internationale qui définit des interfaces techniques communes pour les données génomiques et les analyses. Les partenaires se connectent avec des contrats clairs au lieu de refaire une intégration sur mesure pour chaque lien.

Synaptic Four associe une ingénierie exigeante à un engagement explicite et vécu envers la neurodiversité et l’inclusion des personnes autistes. Cela fait partie de notre identité — pas un ajout marketing à l’histoire technique. En savoir plus : À propos Autisme

Téléchargement (PDF)

Vous pouvez télécharger les documents complets pour impression, archive ou partage avec des collègues. Cette page est une vue d’ensemble plus courte à l’écran avec des liens vers les dépôts.

Résumé

Ferrum implémente un large ensemble d’API du Global Alliance for Genomics and Health (GA4GH) dans un runtime composable, d’abord sur site. Ce document résume la motivation, l’architecture, Crypt4GH et l’exécution multi-moteur, la validation avec la suite indépendante HelixTest, et des benchmarks reproductibles via la démo GA4GH Ferrum sous Apache-2.0. Il explique aussi comment nous utilisons l’ingénierie assistée par IA de façon transparente — comme accélération, pas comme substitut au jugement d’ingénieur.

1. Origine et motivation

Le fossé que nous avons vu

GA4GH définit des API interopérables pour les données génomiques et le calcul (TES, WES, DRS, TRS, htsget, Beacon, Passports, Crypt4GH). Beaucoup de systèmes de production n’en implémentent qu’une partie ; les piles reproductibles inter-services sont rares. L’écosystème bénéficie d’implémentations qui exercent les normes ensemble dans de vrais pipelines.

Travaux connexes

De solides implémentations de composants existent (p. ex. TESK, Funnel, cwl-WES, WESkit, morceaux du GA4GH Starter Kit, intégrations Galaxy). Ferrum vise la combinaison TRS + DRS + WES + TES + htsget + Beacon + Passports + Crypt4GH dans un runtime avec passerelle unifiée, authentification partagée et tests de conformité inter-services continus — pas pour remplacer ces projets, mais comme point d’intégration ciblé.

Pourquoi nous l’avons construit

Synaptic Four est une petite société de conseil. Au lieu d’attendre qu’un client commande une pile intégrée, nous sommes devenu·es notre premier client : Ferrum est à la fois produit et preuve publique de notre façon de travailler — précise, documentée et pilotée par les tests.

“Nous cherchions cet outil intégré. Nous ne l’avons pas trouvé. Alors nous l’avons construit — dans le langage que parle la communauté GA4GH.”

2. Ce qu’est Ferrum

Les services sont composés derrière une passerelle unique (Rust, async). Les métadonnées sont dans PostgreSQL ; les objets dans un stockage compatible S3 (MinIO, S3 cloud, POSIX, backends OpenDAL le cas échéant). Crypt4GH est intégré au niveau DRS avec re-enveloppement d’en-tête O(1) pour la livraison par demandeur.

Le déploiement est sélectif : ne lancez que les services GA4GH dont vous avez besoin. Ferrum Lab Kit (BUSL) fournit une rampe d’accès structurée pour laboratoires, candidats nœud ELIXIR et empreintes de type GDI — voir le dépôt Lab Kit.

Les backends WES incluent Cromwell (WDL), Nextflow, CWL et Snakemake, routés via TES ; SLURM et LSF sont pris en charge pour le HPC sur site.

3. Validation et benchmarks

Les flux de bout en bout couvrent la récupération de workflow TRS, l’accès aux données DRS, l’exécution WES/TES et les profils Crypt4GH optionnels — documentés dans la démo GA4GH Ferrum avec métriques hap.py et micro-benchmarks DRS (clair vs chiffrement au repos). Le périmètre est volontairement modeste (petites tranches de type synthétique) ; nous ne prétendons pas au-delà de ce que nous mesurons.

4. HelixTest : conformité en CI

HelixTest est une suite Apache-2.0 maintenue par Synaptic Four. Elle s’exécute à chaque push/PR Ferrum contre une pile vivante (Postgres, MinIO, Keycloak, données amorcées), couvrant les contrats d’API, l’E2E workflow, les chaînes inter-services, l’auth de type Passports/OIDC et les tests orientés Crypt4GH. Tout le monde peut réutiliser HelixTest pour sa propre plateforme compatible GA4GH. Les résultats sont un signal technique — pas une certification GA4GH officielle.

5. Comment travaille Synaptic Four

L’IA comme outil, pas comme raccourci

Nous utilisons l’ingénierie assistée par IA pour l’échafaudage, la navigation dans les specs et le code répétitif mais précis — jamais comme substitut à l’architecture, la revue ou la responsabilité. La justesse et la conception restent humaines.

“L’IA est un outil. La responsabilité de la justesse, de la conception et des conséquences reste chez l’ingénieur.”

Précision et transparence

Les benchmarks publics indiquent le périmètre des jeux de données, le nombre de répétitions et les limites. La reproductibilité compte : les dépôts de démo épinglent les versions et émettent des artefacts lisibles par machine.

Aperçu des licences

Ferrum : BUSL-1.1 (voir LICENSE et docs/BUSINESS-MODEL.md). HelixTest et démo GA4GH Ferrum : Apache-2.0. Suivez toujours le fichier LICENSE de chaque dépôt.

6. Conclusion

Une petite équipe peut livrer un runtime unifié orienté GA4GH lorsque normes, tests et périmètre honnête sont de première classe. HelixTest et la démo GA4GH rendent cette affirmation vérifiable. Nous accueillons collaboration, partenariats de déploiement et contacts recherche.

Ce livre blanc peut être partagé librement à des fins non commerciales avec attribution.

Dépôts