Souveräne KI-Bereitstellung für deutsche Banken

Souveräne KI-Bereitstellung für deutsche Banken: DORA

Leitfaden 2026 zur souveränen KI-Bereitstellung für deutsche Banken unter DORA. Strategien mit SambaNova, NVIDIA & Red Hat für BaFin-Compliance.

Martin Benes· Gründer & KI-Automatisierungsingenieur2. Mai 20268 Min Lesezeit

Entwurf von Flux Bot · Redigiert von Martin Benes

Im Jahr 2026 hat sich der strategische Imperativ für eine Souveräne KI-Bereitstellung für deutsche Banken von einer reinen Compliance-Checkliste zu einer fundamentalen Säule der betrieblichen Resilienz unter dem Digital Operational Resilience Act (DORA) entwickelt.

TL;DR: Eine Souveräne KI-Bereitstellung für deutsche Banken erfordert einen mehrschichtigen Ansatz, der souveräne Cloud-Infrastrukturen mit portabler Orchestrierung kombiniert, um DORA- und EU-AI-Act-Mandate zu erfüllen. Durch den Einsatz in Deutschland gehosteter Inference-Clouds können Institute Drittpartei-Konzentrationsrisiken eliminieren und gleichzeitig hochperformante KI-Kapazitäten beibehalten.

Wichtige Erkenntnisse

Regulatorische Compliance: Die DORA-Durchsetzung im Jahr 2026 schreibt ein striktes ICT-Drittparteien-Risikomanagement vor, was souveräne Infrastrukturen für kritische Bankfunktionen unumgänglich macht.
Infrastruktur-Innovation: Partnerschaften wie SambaNova und Infercom bieten Deutschlands erste souveräne KI-Inference-Cloud, die mit einer hohen Effizienz von nur 10 kW pro Rack arbeitet.
Architektonische Portabilität: Die Nutzung von Red Hat OpenShift als 'vertrauenswürdige Mittelschicht' stellt sicher, dass Banken einen Vendor Lock-in vermeiden und plattformübergreifende Compliance wahren.
Datenresidenz: Die Oracle EU Sovereign Cloud und die Industrial AI Cloud der Deutschen Telekom bieten lokale Datenresidenz, die sowohl BaFin- als auch DSGVO-Anforderungen erfüllt.

Der regulatorische Katalysator: DORA und der EU AI Act

Seit 2026 wird die regulatorische Landschaft für deutsche Finanzinstitute durch die volle Reife des Digital Operational Resilience Act (DORA) definiert. Dieser Rahmen hat die Art und Weise, wie eine Souveräne KI-Bereitstellung für deutsche Banken konzipiert wird, grundlegend verändert. Es reicht nicht mehr aus, Daten lediglich innerhalb des Europäischen Wirtschaftsraums zu hosten; Banken müssen nun eine 'betriebliche Kontinuität' nachweisen und die Fähigkeit besitzen, Verträge mit Drittanbietern zu beenden, ohne kritische Dienste zu unterbrechen. Dies macht einen Übergang von monolithischen Hyperscaler-Abhängigkeiten hin zu souveränen, modularen Architekturen erforderlich. Der EU AI Act verkompliziert dies zusätzlich, indem er hohe Transparenzstandards und menschliche Aufsicht für 'KI-Systeme mit hohem Risiko' fordert, wie sie etwa bei der Kreditwürdigkeitsprüfung eingesetzt werden.

Laut dem Bundesverband deutscher Banken spielt der EU-Finanzmarkt eine Schlüsselrolle bei der Sicherung des wirtschaftlichen Erfolgs und der Souveränität Europas. Diese Sichtweise spiegelt sich in der strengen Aufsicht der BaFin (Bundesanstalt für Finanzdienstleistungsaufsicht) wider, die verlangt, dass ICT-Dienstleister für kritische Funktionen strenge Resilienzstandards erfüllen. Für eine deutsche Bank bedeutet eine souveräne Bereitstellung, dass der gesamte KI-Stack – von der Siliziumschicht (Chips) bis zur Anwendungsschicht (LLMs) – dem EU-Recht unterliegt und physisch innerhalb der Jurisdiktion angesiedelt ist. Laut BSI (Bundesamt für Sicherheit in der Informationstechnik) ist diese digitale Souveränität entscheidend, um technologische Abhängigkeiten zu reduzieren, die zu geopolitischen Risiken werden könnten.

Die Entwicklung des ICT-Risikomanagements

Unter DORA Kapitel V ist das Management von Drittparteienrisiken zentral. Banken sind nun verpflichtet, ein Informationsregister über alle vertraglichen Vereinbarungen mit ICT-Drittdienstleistern zu führen. Für KI-Bereitstellungen bedeutet dies, dass Black-Box-Modelle, die auf Infrastrukturen außerhalb der EU gehostet werden, zunehmend als Hochrisiko-Assets eingestuft werden. Souveräne Bereitstellungsmodelle mindern dieses Risiko, indem sie klare Audit-Trails und lokale Zuständigkeit für die Datenverarbeitung bieten, was die Berichterstattung für die jährlichen Resilienztests erheblich vereinfacht.

Architektur der Souveränität: On-Premise vs. Sovereign Cloud

Bei der Planung einer Souveräne KI-Bereitstellung für deutsche Banken müssen Architekten zwischen traditionellen On-Premise-Rechenzentren und der aufstrebenden Kategorie der 'Sovereign Clouds' wählen. Während On-Premise-Lösungen ein Höchstmaß an Kontrolle bieten, fehlt ihnen oft die Elastizität, die für moderne Large Language Model (LLM) Workloads erforderlich ist. Sovereign Clouds, wie die Oracle EU Sovereign Cloud, bieten einen Mittelweg, indem sie die Skalierbarkeit einer Public Cloud innerhalb eines Rahmens bieten, der den Datenzugriff auf EU-basiertes Personal beschränkt und alle Operationen dem EU-Datenschutzrecht unterwirft. Dies ermöglicht es Banken, sensible Anwendungen in die Cloud zu verlagern, ohne die Grundprinzipien der digitalen Souveränität zu verletzen.

Wie wir in unserer Analyse über die Strategien für Datensouveränität in der Ära von KI-Agenten erörtert haben, wird der Trend zur lokalen Infrastruktur durch den Bedarf an Umgebungen mit geringer Latenz und hoher Sicherheit vorangetrieben. Für deutsche Banken manifestiert sich dies oft als Hybrid-Cloud-Strategie. Kritische Kernbanksysteme verbleiben On-Premise oder in streng abgeschirmten Private Clouds, während KI-gestützte Kundenservice- und Analyse-Engines auf souveränen Cloud-Plattformen bereitgestellt werden. Diese 'Exit-fähige' Architektur ist eine Kernanforderung der DORA-Compliance und stellt sicher, dass eine Bank Workloads zwischen Anbietern migrieren kann, falls ein Single Point of Failure identifiziert wird.

On-Premise: Bestens geeignet für Kernbanksysteme und hochsensible proprietäre Modelle, bei denen absolute physische Kontrolle erforderlich ist.
Sovereign Cloud: Ideal für die Skalierung von RAG-Pipelines (Retrieval-Augmented Generation) und kundenorientierten KI-Agenten, die erhebliche GPU/RDU-Rechenleistung benötigen.
Hybride Orchestrierung: Einsatz von Abstraktionsschichten, um Workloads nahtlos über beide Umgebungen hinweg zu verwalten.

Anbieteranalyse: SambaNova, NVIDIA und die Silizium-Ebene

Die Hardware-Ebene ist das oft übersehene Fundament einer Souveräne KI-Bereitstellung für deutsche Banken. Im Jahr 2026 ist die Abhängigkeit von einem einzigen GPU-Anbieter zu einem Problem für Regulatoren geworden, die Konzentrationsrisiken fürchten. Infolgedessen sind neue Partnerschaften entstanden, um Alternativen anzubieten. Die Zusammenarbeit zwischen SambaNova und Infercom ist ein Paradebeispiel: Sie starteten Deutschlands erste souveräne Inference-Cloud. Basierend auf den Reconfigurable Dataflow Units (RDUs) von SambaNova bietet diese Infrastruktur eine hocheffiziente Leistung mit durchschnittlich nur 10 kW pro Rack. Diese Effizienz ist entscheidend für Banken, die ihre KI-Workloads skalieren und gleichzeitig ESG-Ziele (Environmental, Social, Governance) erreichen wollen.

Parallel dazu hat die Deutsche Telekom gemeinsam mit NVIDIA die Industrial AI Cloud ins Leben gerufen. Ziel dieser Initiative ist es, die KI-Rechenleistung in Deutschland um 50 % zu steigern und eine sichere, souveräne Infrastruktur für öffentliche Institutionen und Banken bereitzustellen. Durch die Ansiedlung dieser Infrastruktur innerhalb der deutschen Grenzen und den Betrieb nach deutschem Recht bietet die Telekom einen 'sicheren Hafen' für Finanzdaten. Diese Entwicklungen erlauben es Banken, Hardware zu wählen, die am besten zu ihren spezifischen Anwendungsfällen passt – sei es das massive parallele Processing von NVIDIA-GPUs oder die Dataflow-Effizienz von SambaNova-RDUs – ohne den souveränen Status zu opfern.

Performance-Benchmarks und operative Kosten

Bei der Bewertung souveräner Optionen müssen Banken über reine Teraflops hinausblicken. Die Gesamtbetriebskosten (TCO) in einer souveränen Umgebung beinhalten Stromverbrauch, Kühlung und die Kosten für spezialisiertes Personal. Das Modell von SambaNova und Infercom konzentriert sich auf 'Sovereign Inference' – die Phase, in der KI-Modelle tatsächlich genutzt werden, um Vorhersagen oder Texte zu generieren. Durch die Optimierung für Inference können Banken ihre operativen Kosten im Vergleich zu generischen Public-Cloud-Instanzen, die oft für Training-Workloads überdimensioniert sind, erheblich senken.

Operative Realität: Orchestrierung und Portabilität

Die Umsetzung einer Souveräne KI-Bereitstellung für deutsche Banken ist kein einmaliges Setup, sondern eine dauerhafte operative Herausforderung. Red Hat hat sich hier als Schlüsselakteur positioniert, indem es OpenShift als einheitliche Betriebsplattform anbietet. OpenShift bietet eine portable Mittelschicht, die On-Premise-, Public- und Sovereign-Cloud-Infrastrukturen überspannt. Dies ermöglicht es einer Bank, eine KI-Anwendung einmal zu entwickeln und überall bereitzustellen, was die für DORA-Exit-Strategien erforderliche Flexibilität garantiert. Mit Tools wie Red Hat Ansible für die Automatisierung können Banken Compliance im großen Stil durchsetzen und sicherstellen, dass jeder Knoten in ihrem KI-Cluster dieselben Sicherheitsrichtlinien einhält.

Zudem erfordert die Integration souveräner Bereitstellung in bestehende Enterprise-Anwendungsfälle ein robustes API-Management und sichere Konnektivität. Banken setzen zunehmend auf 'Opinionated Reference Architectures', die genau definieren, wie KI-Dienste mit Legacy-Systemen interagieren sollen. Dazu gehört auch der Einsatz von Air-Gapped-Umgebungen für die sensibelste Datenverarbeitung, bei denen das KI-System physisch oder logisch vom öffentlichen Internet isoliert ist. Diese Strenge ist essenziell, um die von DORA geforderte 'digitale operationale Resilienz' aufrechtzuerhalten.

Sicherheit und Daten-Governance: Jenseits der Perimeter

Sicherheit im souveränen Kontext geht weit über Firewalls hinaus. Sie umfasst die Datenherkunft (Data Lineage), Modell-Governance und die Verhinderung von Datenabfluss in den öffentlichen Raum. Für deutsche Banken bedeutet dies die Implementierung von RAG-Pipelines (Retrieval-Augmented Generation), die Daten lokal verarbeiten, anstatt sie an externe LLM-Anbieter zu senden. Bei einer Souveräne KI-Bereitstellung für deutsche Banken müssen sowohl die Modellgewichte als auch die Retrieval-Datenbank innerhalb der souveränen Grenze verbleiben. Dies stellt sicher, dass selbst wenn ein Modell mit sensiblen Finanzdaten 'gefinetuned' oder 'gepromptet' wird, diese Informationen unter der Kontrolle der Bank bleiben.

Die BaFin gibt klare Leitlinien vor, die in diese souveränen Architekturen integriert werden müssen. Beispielsweise sind der Einsatz von hardwarebasierten Sicherheitsmodulen (HSM) für das Schlüsselmanagement und die Implementierung von 'Zero Trust'-Architekturen Standardpraktiken. Im Jahr 2026 konzentrieren sich Banken zudem auf die 'Modell-Souveränität' – die Fähigkeit zu verifizieren, dass die verwendeten KI-Modelle nicht manipuliert wurden und keine versteckten Biases oder Schwachstellen enthalten. Dies erfordert eine transparente Lieferkette für KI, von den Trainingsdaten bis zur finalen Inference-Engine.

Fazit: Die Zukunft der Banken-Resilienz

Mit Blick auf das Ende des Jahrzehnts wird die Souveräne KI-Bereitstellung für deutsche Banken eher Standard als Ausnahme sein. Die Kombination aus den strikten Resilienz-Anforderungen von DORA und den Transparenzmandaten des EU AI Acts hat nicht-souveräne KI für den Finanzsektor weitgehend ausgeschlossen. Banken, die souveräne Architekturen implementiert haben – unter Nutzung von Anbietern wie Infercom, Deutsche Telekom und Oracle – sind besser positioniert, um ohne regulatorische Reibungsverluste zu innovieren. Sie schaffen ein Fundament, das nicht nur sicher und regelkonform, sondern auch nachhaltig und effizient ist.

Letztlich geht es beim Wechsel zu souveräner KI um Vertrauen. In einer digitalen Ökonomie ist das wertvollste Gut einer Bank das Vertrauen ihrer Kunden und die Stabilität ihrer Operationen. Indem deutsche Banken durch souveräne Bereitstellung die Kontrolle über ihr technologisches Schicksal übernehmen, sichern sie ihre Wettbewerbsfähigkeit im globalen Markt und wahren gleichzeitig die hohen Standards europäischer Datenschutz- und Betriebsexzellenz. Weitere Informationen zur Navigation durch diese komplexen Anforderungen finden Sie in unserem Compliance-Ressourcen-Zentrum.

Häufige Fragen

Unter dem Digital Operational Resilience Act (DORA) ist eine souveräne Bereitstellung essenziell, um die betriebliche Kontinuität zu wahren und Konzentrationsrisiken bei Drittanbietern zu steuern. DORA schreibt vor, dass Finanzinstitute die volle Kontrolle über ihre ICT-Dienstleistungsketten haben müssen, insbesondere bei kritischen oder wichtigen Funktionen. KI-Systeme, die in der Kreditrisikobewertung, Betrugserkennung oder im Kernbetrieb eingesetzt werden, fallen unter diese strenge Aufsicht. Eine souveräne Bereitstellung stellt sicher, dass die Infrastruktur der EU-Jurisdiktion unterliegt, was die Einhaltung der DORA-Anforderungen bezüglich Auditierbarkeit, Meldewesen und der Fähigkeit zur Umsetzung einer Exit-Strategie ohne Datenverlust erleichtert. Ohne souveräne Basis riskieren deutsche Banken regulatorische Sanktionen und betriebliche Instabilität, falls ein Nicht-EU-Hyperscaler regionale Ausfälle oder rechtliche Konflikte erlebt, die die Serviceverfügbarkeit oder Datenintegrität in Krisenzeiten beeinträchtigen könnten.

Eine Sovereign AI Cloud unterscheidet sich von der klassischen Public Cloud durch strikte Datenresidenz, lokale operative Kontrolle und rechtliche Sicherheit innerhalb der Europäischen Union. Im Gegensatz zu allgemeinen Public Clouds werden souveräne Clouds oft von EU-basierten Unternehmen (wie Infercom oder der Telekom) betrieben und unterliegen ausschließlich EU-Recht und dem deutschen BDSG. Das bedeutet, dass Nicht-EU-Behörden den Anbieter nicht rechtlich zwingen können, Zugriff auf gespeicherte Daten zu gewähren, wie es etwa durch den U.S. CLOUD Act möglich wäre. Technisch bieten souveräne Clouds oft physische oder logische Isolation, spezialisierte Hardware wie SambaNova RDUs, die für lokale Inference optimiert sind, und erweiterte Sicherheitsprotokolle für regulierte Sektoren wie das Bankwesen, wodurch sichergestellt wird, dass Metadaten und Modellgewichte niemals den souveränen Perimeter verlassen.

Die Partnerschaft zwischen SambaNova und Infercom ist bedeutend, da sie die erste dedizierte souveräne KI-Inference-Cloud mit Standort in Deutschland bereitstellt. Für Banken bedeutet dies Zugriff auf Hochleistungs-KI-Rechenpower – speziell die SambaNova RDUs – ohne dass Daten nationale Grenzen überschreiten. Diese Partnerschaft schließt die Lücke in der Hardware-Souveränität, indem sie eine Alternative zu den dominanten globalen GPU-Anbietern bietet. Aus Kosten- und Nachhaltigkeitssicht ermöglicht die Effizienz von 10 kW pro Rack eine ökonomische Skalierung von LLM-Inference bei gleichzeitiger Erfüllung strenger ESG-Anforderungen. Es ermöglicht 'Sovereign Inference', bei der eine Bank Large Language Models (LLMs) in einer Produktionsumgebung einsetzen kann, die vollständig mit den BaFin-Anforderungen für inländische Datenverarbeitung und betriebliche Resilienz konform ist.

Ein Vendor Lock-in ist ein zentrales Bedenken unter der DORA-Anforderung für 'Exit-Strategien'. Um dies zu mildern, setzen deutsche Banken auf Hybrid-Cloud-Architekturen mit Orchestrierungsschichten wie Red Hat OpenShift. Dies erlaubt es ihnen, KI-Anwendungen in Containern zu verpacken, die ohne große Code-Anpassungen zwischen On-Premise-Servern, Private Clouds und verschiedenen souveränen Cloud-Anbietern verschoben werden können. Durch die Beibehaltung einer portablen Mittelschicht stellen Banken sicher, dass sie nicht an proprietäre APIs oder Hardware eines einzelnen Anbieters gebunden sind. Diese Flexibilität ist entscheidend, falls sich das Risikoprofil eines Dienstleisters ändert oder eine effizientere souveräne Infrastruktur verfügbar wird. Zudem sichert die Nutzung offener Standards für den Modellaustausch (wie ONNX), dass die KI-Modelle selbst über verschiedene Inference-Engines hinweg portabel bleiben.

Die BaFin verlangt, dass Auslagerungsvereinbarungen für kritische Bankfunktionen den Standards von MaRisk und BAIT entsprechen. Für souveräne KI bedeutet dies, dass die Bank sicherstellen muss, dass der Anbieter umfassende Audit-Rechte, transparente Datenverarbeitungsstandorte und robuste Sicherheitsmaßnahmen gemäß BSI-Standards bietet. Die BaFin betont, dass die Letztverantwortung für das Risikomanagement bei der Bank verbleibt, nicht beim Anbieter. Souveräne Bereitstellungen müssen daher detaillierte Service Level Agreements (SLAs), klare Business-Continuity-Pläne und technische Architekturen umfassen, die ein Echtzeit-Monitoring der KI-Leistung und des Datenzugriffs ermöglichen. So kann die Bank bei regulatorischen Prüfungen jederzeit die Compliance nachweisen und sicherstellen, dass alle IT-Systeme den Anforderungen an die operationale Resilienz gerecht werden.

Brauchen Sie das für Ihr Business?

Wir können das für Sie implementieren.

Kontakt aufnehmen