Zum Hauptinhalt springen
On-Premise KI-Infrastruktur

GPT-5-Klasse KI
auf eigener Hardware
betreiben.

On-Premise-LLM-Appliance für deutsche und österreichische Mittelständler. EU AI Act ready. Ab 2.950 €. Amortisation in unter 18 Monaten.

Ihre KI. Ihre Daten. Ihr Serverraum.

EU AI Act tritt am 2. August 2026 in Kraft— Ist Ihre KI-Infrastruktur bereit?
GPU-gestützte KI
8B–70B+
Parameter-Modelle
Keine Cloud-Abhängigkeit
30–100+
Nutzer unterstützt
Vollständige Datensouveränität
100%
EU AI Act & DSGVO-konform
Amortisiert sich selbst
<18 Mo.
Vollständige Amortisation

Auf NVIDIA-Blackwell-Hardware aufgebaut

NVIDIASupermicro
Für wen das ist

Für den richtigen Käufer gebaut

Wir halten den Anwendungsbereich bewusst eng — so bleibt das Wertversprechen ehrlich. Wenn Sie nicht ins Profil passen, sagen wir es lieber direkt, als Ihre Zeit zu verschwenden.

Geeignet für

Unternehmen mit sensiblen Daten und realen Cloud-KI-Kosten.

  • 10–500 Mitarbeitende
  • Recht, Medizin, Finanzen, Verteidigungs-Zulieferer, F&E-intensive Fertigung
  • Aktuell 15.000 €+/Jahr für Cloud-KI
  • Oder Cloud-KI aus Compliance-Gründen nicht erlaubt

Nicht geeignet für

Wenn etwas davon auf Sie zutrifft, sind wir noch nicht die richtige Lösung.

  • Einzelberater und Ein-Personen-Betriebe
  • Unternehmen mit weniger als 2 Mio. € Jahresumsatz
  • Teams mit weniger als 5 KI-Nutzern
  • Wer ein billiges Experiment sucht, kein Arbeitspferd
Das Problem

Cloud-KI belastet Ihr Budget — jeden einzelnen Monat

Die meisten Unternehmen unterschätzen, wie schnell sich KI-Abonnementkosten summieren. So viel kosten 100 Nutzer tatsächlich pro Jahr.

Mit dem EU AI Act ab 2. August 2026 drohen Unternehmen, die KI für Hochrisiko-Aufgaben einsetzen, verpflichtende Compliance-Anforderungen — oder Bußgelder bis zu 35 Mio. €.

ChatGPT Business
€25–30 / / Nutzer / Monat
€30,000–36,000
pro Jahr für 100 Nutzer
Claude Team
€25 / / Nutzer / Monat
€30,000
pro Jahr für 100 Nutzer
Enterprise Tier
€60+ / / Nutzer / Monat
€72,000+
pro Jahr für 100 Nutzer

Daten verlassen Ihr Gebäude

Jeder Prompt, jedes Dokument, jedes Geschäftsgeheimnis — gesendet an US-Server

Unvorhersehbare Kosten

API-Rechnungen steigen mit der Nutzung. Starke Monate können 3–5× Ihre Schätzung übersteigen

Regulatorisches Risiko

Der EU AI Act (Aug. 2026) stuft KI in Recht, Gesundheit und Finanzen als Hochrisiko ein — Cloud-KI kann die verpflichtenden Compliance-Anforderungen nicht erfüllen

Anbieterausfälle

Wenn OpenAI oder Anthropic ausfällt, steht Ihr gesamtes Team still
Die Lösung

Enterprise-KI, die in Ihrem Serverraum lebt

Eine kompakte, GPU-gestützte Appliance, vorinstalliert mit modernsten Open-Source-KI-Modellen. Anschließen, mit Ihrem Netzwerk verbinden und KI in Stunden nutzen — nicht in Wochen.

WerkHub AI Appliance — GPU-gestützter On-Premise-Server
Kompakt. Leise. Leistungsstark.
Passt in jedes Standard-Serverrack oder auf einen Schreibtisch
Was Ihr Team sieht
Fasse den Q1-Umsatzbericht zusammen und markiere Auffälligkeiten.
Der Q1-Umsatz betrug 2,4 Mio. € (+12 % ggü. Vorjahr). Zwei Auffälligkeiten erkannt: DACH-Region sank um 8 % trotz Expansion, und die SaaS-Abwanderungsrate stieg im März auf 4,2 %...
Läuft lokal auf Ihrer WerkHub AI Appliance — keine Daten verlassen Ihr Netzwerk

NVIDIA Professional-GPUs

DGX Spark (GB10, 128 GB unified) oder RTX PRO 6000 Blackwell (96 GB GDDR7) — Rechenzentrumsqualität, kommerziell lizenziert, 24/7-Betrieb

8B – 120B+ Parameter-Modelle

Llama 4, Gemma 4, Qwen 3.6, GLM-4.7, Devstral 2, Nemotron 3 Super — quantisiert für Geschwindigkeit, optimiert für Geschäftsaufgaben. Modelle jederzeit wechselbar.

Bis zu 100 gleichzeitige Nutzer

Optimierter Inferenz-Stack (vLLM) verarbeitet 10–15 gleichzeitige Anfragen mit Sub-Sekunden-Latenz

RAG-fähige Architektur

Verbinden Sie Ihre Dokumente, Wissensdatenbank und internen Daten. Die KI kennt Ihr Unternehmen.

Vorkonfiguriert & sicher

Wird mit allem vorinstalliert geliefert. Air-Gap-fähig. Kein Internet für den Betrieb erforderlich.
So funktioniert's

Von der Bestellung zur KI in drei Schritten

Keine Cloud-Konten, kein komplexes Setup, keine laufende Anbieterverwaltung. Wir kümmern uns um die schwierigen Teile, damit sich Ihr Team auf die Nutzung der KI konzentrieren kann.

01

Wir konfigurieren

Nennen Sie uns Ihre Teamgröße, Anwendungsfälle und Compliance-Anforderungen. Wir wählen die passende GPU, Modelle und den Software-Stack — maßgeschneidert für Ihre Arbeitsbelastung.

Typische Konfiguration dauert 1–2 Werktage
02

Wir deployen

Ihre vorkonfigurierte Appliance wird betriebsfertig geliefert. Wir unterstützen bei der Netzwerkintegration, dem Nutzer-Onboarding und der initialen Modellanpassung — remote oder vor Ort.

Von der Bestellung zur laufenden KI: 2–4 Wochen
03

Ihr Team nutzt KI

Ihre Mitarbeiter greifen über eine vertraute Chat-Oberfläche auf KI zu — keine Schulung nötig. Dokumente bleiben lokal, Kosten bleiben planbar, und Sie behalten die Kontrolle.

Keine Nutzergebühren, unbegrenzte Nutzung ab Tag eins
Warum On-Premise

Vier Gründe, KI ins Haus zu holen

Datensouveränität

Ihre Prompts, Dokumente und Geschäftsgeheimnisse verlassen niemals Ihr Gebäude. EU AI Act- und DSGVO-konform durch Architektur, nicht durch Versprechen. Vollständige Audit-Trails und Daten-Governance integriert.

Planbare Kosten

Einmalige Hardware-Investition. Keine Nutzergebühren, keine Token-Kosten, keine Überraschungsrechnungen. Ihre 101. Anfrage kostet genauso viel wie Ihre erste — null.

Kein Vendor Lock-in

Nutzen Sie Llama, Mistral, Qwen oder jedes Open-Source-Modell. Wenn der nächste Durchbruch kommt, herunterladen und deployen — kein Warten auf einen Anbieter.

Immer verfügbar

Keine Cloud-Ausfälle. Keine API-Ratenlimits. Keine Leistungseinbußen zu Spitzenzeiten. Ihre KI läuft in Ihrem Netzwerk, nach Ihrem Zeitplan.
KI-Agenten-Vorlagen

Über 240 vordefinierte Agenten-Vorlagen — bereit für jede Abteilung

Kuratierte Automatisierungsrezepte über 22 Branchen — alle on-premise, hinter Ihrer Firewall, vollständig DSGVO-konform.

Was wir mit „Agent“ meinen: eine vordefinierte Workflow-Vorlage — System-Prompt + RAG-Anbindung an Ihre Dokumente + optional Tool-Use (E-Mail, CRM, ERP, Web-Browse). Keine vollautonomen KI-Agenten — Sie behalten Freigabe-Kontrolle bei jedem Schritt.
Kernfähigkeiten
Dokumentenerstellung
Gemma 4 31B · Qwen 3.6 35B
Internes Wissens-Q&A
Nemotron 3 Super · Qwen3-Coder-Next 80B
E-Mail-Triage
Gemma 4 31B · Mistral Small 3.1
Technische Dokumentation
Devstral 2 · GLM-4.7 30B
Agentisches Coding
Claude Code · Codex · OpenCode · OpenClaw
Mehrsprachige Übersetzung
Qwen 3.6 35B · Nemotron 3 Super
Vorgestellte Vorlagen
Cash-Flow Runway Forecaster13-week forecast + runway view to anticipate shortfalls
Compliance RadarCentralized compliance calendar with owners and backups
Customer Inbox TriageTags, SLAs, templates, and escalation rules
Hiring Pipeline KitJob posts, screening steps, interview scorecards, offer checklists
Vorgestellte Vorlagen
Reconciliation AutopilotPull source data, propose matches, isolate exceptions, produce audit-ready packs
Document-to-Ledger PipelineExtract structured fields from invoices/statements into posting-ready entries
Tax Change RadarTrack regulatory updates and generate firm-specific checklists
Vorgestellte Vorlagen
13-Week Cash Flow ForecasterRolling forecast with scenario analysis and variance explanations
Uncertainty Scenario BudgetConvert uncertainty into 3 scenarios with trigger thresholds
Expense Compliance EngineReceipt capture, policy enforcement, and card reconciliation
Vorgestellte Vorlagen
Customer Inbox TriageTriage system with tags, SLAs, templates, escalation rules
Review Response WorkflowAuto-response templates for customer reviews
CRM-Lite Lead Follow-UpSimple pipeline with automated follow-ups
Vorgestellte Vorlagen
CRM-Lite Lead Follow-UpTrack leads with automated reminders
Source HunterAutomated market research and comparables
Review Response WorkflowRespond to client and guest reviews
Vorgestellte Vorlagen
Scope Change ControlManage requirement volatility with structured change requests
Context Switching GuardrailsReduce interruptions and batch shallow work
Task WhispererTrack tasks, deadlines, and dependencies
Alle Vorlagen laufen lokal auf Ihrer WerkHub AI Appliance. Ihre Daten verlassen niemals Ihr Netzwerk.

240+ vordefinierte Workflow-Vorlagen über 24 Branchen — anpassen, kombinieren oder eigene erstellen.

Frühzugang

Für echte Deployments entwickelt — nicht für Pitch-Decks

WerkHub AI ist für KMU gebaut, die GPT-5-Klasse-Leistung im eigenen Netzwerk brauchen. Frühzugangs-Partner erhalten persönliche Engineering-Begleitung und Preise zu heutigen Materialkosten.

5–500
Nutzer-Deployments by Design
24/7
Für Dauerbetrieb on-premise konzipiert
100 %
EU AI Act- & DSGVO-konform
Frühzugang offen

Frühzugangsprogramm jetzt offen

Die ersten 10 Kunden erhalten 12 Monate Premium-Support und eine kostenlose Discovery-Session vor Ort (bis 500 km um unseren Standort Haskovo/Sofia) — ohne Aufpreis.

  • 12 Monate Premium-Support inklusive
  • Kostenlose Discovery-Session vor Ort
  • Preise zu aktuellen Materialkosten fixiert
Frühzugang anfragen
Fallstudie

Ein reales Deployment im Detail

Holen Sie sich das ausführliche PDF — Hardware-Spezifikationen, Integrationsansatz, QA-Prozess und Projektzeitplan eines aktuellen Builds.

Möchten Sie das detaillierte PDF mit allen Spezifikationen?

Komponentenliste, Architekturdiagramme und Projektzeitplan.

Hardware-Konfigurationen

Wählen Sie Ihre Konfiguration

Jede Appliance wird vorkonfiguriert mit dem vollständigen Software-Stack geliefert — bereit zum Einsatz in Stunden. Individuelle Konfigurationen auf Anfrage.

Alle Preise sind geschätzte Materialkosten + Montage. Endpreise hängen von der Konfiguration, GPU-Verfügbarkeit und aktuellen Marktbedingungen ab.
Inklusive: Hardware, vorinstallierter Software-Stack, initiale Modellbereitstellung und Setup-Dokumentation.

Staatliche Förderung

Bis zu 50 % staatliche Zuschüsse

Deutsche Förderprogramme können Ihre Investition erheblich reduzieren. Hier die wichtigsten Programme im Überblick.

Digitalbonus Bayern

Plus
bis zu 30.000 €
Fördersatz: 50 %

Zuschuss von bis zu 50 % der Digitalisierungsprojektkosten (max. 60.000 €). Deckt die gesamte KI-Lösung ab — Software, Deployment, Integration, Schulung und Appliance-Hardware.

Förderfähig: Bayerische KMU, <50 Mitarbeiter, <10 Mio. € Umsatz

Innovationsgutschein

Bayern
bis zu 49.750 €
Fördersatz: 50–60 %

Für individuelle KI-Entwicklung und Innovation. Standardstufe: bis 22.800 € (60 %). Spezialstufe: bis 49.750 € (50 %). Deckt F&E-Dienstleistungen, nicht Hardware.

Förderfähig: Bayerische KMU mit F&E-Projekten

Forschungszulage

Bundesweit
25–35 %
Fördersatz: Steuerliche Förderung

Steuerliche F&E-Förderung des Bundes. 25 % der förderfähigen Kosten (35 % für KMU), bis 1 Mio. €/Jahr. Keine Antragsfrist — wird mit der Jahressteuererklärung geltend gemacht.

Förderfähig: Alle deutschen Unternehmen, jede Größe, jedes Bundesland
FAQ

Häufig gestellte Fragen

Alles, was Sie über den Einsatz von On-Premise-KI mit WerkHub AI wissen müssen.

Jede Appliance wird mit Enterprise-Komponenten geliefert, die für den 24/7-Betrieb ausgelegt sind. Wir bieten optionale Wartungsverträge mit Hardware-Austausch am nächsten Werktag. Das System nutzt RAID-Speicher, sodass ein einzelner Laufwerksausfall keinen Datenverlust verursacht. Für kritische Deployments empfehlen wir eine redundante Konfiguration.

Sie haben die volle Kontrolle über Modell-Updates. Wenn ein neues Open-Source-Modell veröffentlicht wird, stellen wir ein getestetes Update-Paket bereit, das Sie nach Belieben einspielen können — keine erzwungenen Updates, keine überraschenden Änderungen. Ihr Team kann auch eigenständig Modelle herunterladen und deployen. Wir bieten einen optionalen Managed-Update-Service, wenn Sie wartungsfreien Betrieb bevorzugen.

Ja. Die Appliance nutzt Standard-Inferenz-Frameworks (vLLM, Ollama), die jedes GGUF- oder Safetensors-Modell unterstützen. Wenn Sie feinabgestimmte Modelle aus Ihrer eigenen Trainingspipeline haben, können Sie diese direkt deployen. Wir bieten auch Fine-Tuning-Services an, wenn Sie Modelle für Ihre spezifische Domäne anpassen möchten.

Von der Bestellung bis zum voll funktionsfähigen KI-System: typischerweise 2–4 Wochen. Die Appliance wird vorkonfiguriert mit Ihren gewählten Modellen und dem Software-Stack geliefert. Die Einrichtung vor Ort dauert meist weniger als einen Tag — Strom anschließen, mit Ihrem Netzwerk verbinden, und Ihr Team kann sofort KI nutzen.

Der EU AI Act (gültig ab 2. August 2026) stuft viele geschäftliche KI-Anwendungen als Hochrisiko ein und erfordert vollständige Transparenz, Audit-Trails und Daten-Governance. Mit On-Premise-KI verlassen Ihre Daten nie Ihr Gebäude — was grenzüberschreitende Datentransferrisiken eliminiert. Sie haben die vollständige Kontrolle über Modellverhalten, Protokollierung und Compliance-Dokumentation. Wir stellen Compliance-Dokumentationsvorlagen als Teil der Bereitstellung zur Verfügung.

Jede Appliance enthält 12 Monate technischen Support für Software-Konfiguration, Modell-Deployment-Unterstützung und Fehlerbehebung. Erweiterte Supportverträge mit garantierten Reaktionszeiten sind verfügbar. Wir bieten außerdem initiale Nutzerschulung und Onboarding-Dokumentation für Ihr Team.

Für ein 100-köpfiges Team kosten Cloud-KI-Abonnements 30.000–72.000+ € pro Jahr. Die WerkHub AI Appliance ist eine einmalige Investition ab 5.900 € (ab 2.950 € mit Digitalbonus) und skaliert bis 65.000 € für Enterprise-Deployments. Minimale laufende Kosten (Strom und optionale Wartung). Die meisten Kunden sehen den vollständigen ROI innerhalb von 12–18 Monaten. Nutzen Sie unseren ROI-Rechner für einen personalisierten Vergleich.

Die Appliance läuft vollständig offline — keine Internetverbindung für die KI-Inferenz erforderlich. Das macht sie geeignet für Hochsicherheitsumgebungen. Internet wird nur benötigt, wenn Sie neue Modelle herunterladen oder Software-Updates erhalten möchten — und selbst dann können Modelle per USB für vollständig air-gapped Setups übertragen werden.

Jetzt starten

Kostenlose Beratung buchen

Erzählen Sie uns von Ihrem Team und Ihren KI-Anforderungen. Wir melden uns mit einer maßgeschneiderten Lösung, Konfigurationsempfehlung und einem Angebot.

Pflichtfeld