What happens if the hardware fails?

Every appliance ships with enterprise-grade components rated for 24/7 operation. We offer optional maintenance contracts with next-business-day hardware replacement.

How long does deployment take?

From order to a fully running AI system: typically 2–4 weeks. On-site setup usually takes less than a day.

How does this help with EU AI Act compliance?

With on-premise AI, your data never leaves your building — eliminating cross-border data transfer risks.

How does the pricing compare to cloud AI long-term?

The WerkHub AI appliance is a one-time investment starting at €5,900 (from €2,950 with Digitalbonus). Most customers see full ROI within 12–18 months.

Is the appliance air-gapped? Does it need internet?

The appliance runs completely offline — no internet connection required for AI inference.

On-Premise KI-Infrastruktur

GPT-5-Klasse KI
auf eigener Hardware
betreiben.

On-Premise-LLM-Appliance für deutsche und österreichische Mittelständler. EU AI Act ready. Ab 2.950 €. Amortisation in unter 18 Monaten.

Ihre KI. Ihre Daten. Ihr Serverraum.

EU AI Act tritt am 2. August 2026 in Kraft— Ist Ihre KI-Infrastruktur bereit?

GPU-gestützte KI

8B–70B+

Parameter-Modelle

Keine Cloud-Abhängigkeit

30–100+

Nutzer unterstützt

Vollständige Datensouveränität

100%

EU AI Act & DSGVO-konform

Amortisiert sich selbst

<18 Mo.

Vollständige Amortisation

Beratung buchen

ROI-Rechner starten

Auf NVIDIA-Blackwell-Hardware aufgebaut

Für wen das ist

Für den richtigen Käufer gebaut

Wir halten den Anwendungsbereich bewusst eng — so bleibt das Wertversprechen ehrlich. Wenn Sie nicht ins Profil passen, sagen wir es lieber direkt, als Ihre Zeit zu verschwenden.

Geeignet für

Unternehmen mit sensiblen Daten und realen Cloud-KI-Kosten.

10–500 Mitarbeitende
Recht, Medizin, Finanzen, Verteidigungs-Zulieferer, F&E-intensive Fertigung
Aktuell 15.000 €+/Jahr für Cloud-KI
Oder Cloud-KI aus Compliance-Gründen nicht erlaubt

Nicht geeignet für

Wenn etwas davon auf Sie zutrifft, sind wir noch nicht die richtige Lösung.

Einzelberater und Ein-Personen-Betriebe
Unternehmen mit weniger als 2 Mio. € Jahresumsatz
Teams mit weniger als 5 KI-Nutzern
Wer ein billiges Experiment sucht, kein Arbeitspferd

Das Problem

Cloud-KI belastet Ihr Budget — jeden einzelnen Monat

Die meisten Unternehmen unterschätzen, wie schnell sich KI-Abonnementkosten summieren. So viel kosten 100 Nutzer tatsächlich pro Jahr.

Mit dem EU AI Act ab 2. August 2026 drohen Unternehmen, die KI für Hochrisiko-Aufgaben einsetzen, verpflichtende Compliance-Anforderungen — oder Bußgelder bis zu 35 Mio. €.

ChatGPT Business

€25–30 / / Nutzer / Monat

€30,000–36,000

pro Jahr für 100 Nutzer

Claude Team

€25 / / Nutzer / Monat

€30,000

pro Jahr für 100 Nutzer

Enterprise Tier

€60+ / / Nutzer / Monat

€72,000+

pro Jahr für 100 Nutzer

Daten verlassen Ihr Gebäude

Jeder Prompt, jedes Dokument, jedes Geschäftsgeheimnis — gesendet an US-Server

Unvorhersehbare Kosten

API-Rechnungen steigen mit der Nutzung. Starke Monate können 3–5× Ihre Schätzung übersteigen

Regulatorisches Risiko

Der EU AI Act (Aug. 2026) stuft KI in Recht, Gesundheit und Finanzen als Hochrisiko ein — Cloud-KI kann die verpflichtenden Compliance-Anforderungen nicht erfüllen

Anbieterausfälle

Wenn OpenAI oder Anthropic ausfällt, steht Ihr gesamtes Team still

Die Lösung

Enterprise-KI, die in Ihrem Serverraum lebt

Eine kompakte, GPU-gestützte Appliance, vorinstalliert mit modernsten Open-Source-KI-Modellen. Anschließen, mit Ihrem Netzwerk verbinden und KI in Stunden nutzen — nicht in Wochen.

WerkHub AI Appliance — GPU-gestützter On-Premise-Server

Kompakt. Leise. Leistungsstark.

Passt in jedes Standard-Serverrack oder auf einen Schreibtisch

Was Ihr Team sieht

Fasse den Q1-Umsatzbericht zusammen und markiere Auffälligkeiten.

Der Q1-Umsatz betrug 2,4 Mio. € (+12 % ggü. Vorjahr). Zwei Auffälligkeiten erkannt: DACH-Region sank um 8 % trotz Expansion, und die SaaS-Abwanderungsrate stieg im März auf 4,2 %...

Läuft lokal auf Ihrer WerkHub AI Appliance — keine Daten verlassen Ihr Netzwerk

NVIDIA Professional-GPUs

DGX Spark (GB10, 128 GB unified) oder RTX PRO 6000 Blackwell (96 GB GDDR7) — Rechenzentrumsqualität, kommerziell lizenziert, 24/7-Betrieb

8B – 120B+ Parameter-Modelle

Llama 4, Gemma 4, Qwen 3.6, GLM-4.7, Devstral 2, Nemotron 3 Super — quantisiert für Geschwindigkeit, optimiert für Geschäftsaufgaben. Modelle jederzeit wechselbar.

Bis zu 100 gleichzeitige Nutzer

Optimierter Inferenz-Stack (vLLM) verarbeitet 10–15 gleichzeitige Anfragen mit Sub-Sekunden-Latenz

RAG-fähige Architektur

Verbinden Sie Ihre Dokumente, Wissensdatenbank und internen Daten. Die KI kennt Ihr Unternehmen.

Vorkonfiguriert & sicher

Wird mit allem vorinstalliert geliefert. Air-Gap-fähig. Kein Internet für den Betrieb erforderlich.

So funktioniert's

Von der Bestellung zur KI in drei Schritten

Keine Cloud-Konten, kein komplexes Setup, keine laufende Anbieterverwaltung. Wir kümmern uns um die schwierigen Teile, damit sich Ihr Team auf die Nutzung der KI konzentrieren kann.

Wir konfigurieren

Nennen Sie uns Ihre Teamgröße, Anwendungsfälle und Compliance-Anforderungen. Wir wählen die passende GPU, Modelle und den Software-Stack — maßgeschneidert für Ihre Arbeitsbelastung.

Typische Konfiguration dauert 1–2 Werktage

Wir deployen

Ihre vorkonfigurierte Appliance wird betriebsfertig geliefert. Wir unterstützen bei der Netzwerkintegration, dem Nutzer-Onboarding und der initialen Modellanpassung — remote oder vor Ort.

Von der Bestellung zur laufenden KI: 2–4 Wochen

Ihr Team nutzt KI

Ihre Mitarbeiter greifen über eine vertraute Chat-Oberfläche auf KI zu — keine Schulung nötig. Dokumente bleiben lokal, Kosten bleiben planbar, und Sie behalten die Kontrolle.

Keine Nutzergebühren, unbegrenzte Nutzung ab Tag eins

Warum On-Premise

Vier Gründe, KI ins Haus zu holen

Datensouveränität

Ihre Prompts, Dokumente und Geschäftsgeheimnisse verlassen niemals Ihr Gebäude. EU AI Act- und DSGVO-konform durch Architektur, nicht durch Versprechen. Vollständige Audit-Trails und Daten-Governance integriert.

Planbare Kosten

Einmalige Hardware-Investition. Keine Nutzergebühren, keine Token-Kosten, keine Überraschungsrechnungen. Ihre 101. Anfrage kostet genauso viel wie Ihre erste — null.

Kein Vendor Lock-in

Nutzen Sie Llama, Mistral, Qwen oder jedes Open-Source-Modell. Wenn der nächste Durchbruch kommt, herunterladen und deployen — kein Warten auf einen Anbieter.

Immer verfügbar

Keine Cloud-Ausfälle. Keine API-Ratenlimits. Keine Leistungseinbußen zu Spitzenzeiten. Ihre KI läuft in Ihrem Netzwerk, nach Ihrem Zeitplan.

KI-Agenten-Vorlagen

Über 240 vordefinierte Agenten-Vorlagen — bereit für jede Abteilung

Kuratierte Automatisierungsrezepte über 22 Branchen — alle on-premise, hinter Ihrer Firewall, vollständig DSGVO-konform.

Was wir mit „Agent“ meinen: eine vordefinierte Workflow-Vorlage — System-Prompt + RAG-Anbindung an Ihre Dokumente + optional Tool-Use (E-Mail, CRM, ERP, Web-Browse). Keine vollautonomen KI-Agenten — Sie behalten Freigabe-Kontrolle bei jedem Schritt.

Kernfähigkeiten

Dokumentenerstellung

Gemma 4 31B · Qwen 3.6 35B

Internes Wissens-Q&A

Nemotron 3 Super · Qwen3-Coder-Next 80B

E-Mail-Triage

Gemma 4 31B · Mistral Small 3.1

Technische Dokumentation

Devstral 2 · GLM-4.7 30B

Agentisches Coding

Claude Code · Codex · OpenCode · OpenClaw

Mehrsprachige Übersetzung

Qwen 3.6 35B · Nemotron 3 Super

Vorgestellte Vorlagen

Cash-Flow Runway Forecaster— 13-week forecast + runway view to anticipate shortfalls

Compliance Radar— Centralized compliance calendar with owners and backups

Customer Inbox Triage— Tags, SLAs, templates, and escalation rules

Hiring Pipeline Kit— Job posts, screening steps, interview scorecards, offer checklists

Vorgestellte Vorlagen

Reconciliation Autopilot— Pull source data, propose matches, isolate exceptions, produce audit-ready packs

Document-to-Ledger Pipeline— Extract structured fields from invoices/statements into posting-ready entries

Tax Change Radar— Track regulatory updates and generate firm-specific checklists

Vorgestellte Vorlagen

13-Week Cash Flow Forecaster— Rolling forecast with scenario analysis and variance explanations

Uncertainty Scenario Budget— Convert uncertainty into 3 scenarios with trigger thresholds

Expense Compliance Engine— Receipt capture, policy enforcement, and card reconciliation

Vorgestellte Vorlagen

Customer Inbox Triage— Triage system with tags, SLAs, templates, escalation rules

Review Response Workflow— Auto-response templates for customer reviews

CRM-Lite Lead Follow-Up— Simple pipeline with automated follow-ups

Vorgestellte Vorlagen

CRM-Lite Lead Follow-Up— Track leads with automated reminders

Source Hunter— Automated market research and comparables

Review Response Workflow— Respond to client and guest reviews

Vorgestellte Vorlagen

Scope Change Control— Manage requirement volatility with structured change requests

Context Switching Guardrails— Reduce interruptions and batch shallow work

Task Whisperer— Track tasks, deadlines, and dependencies

Alle Vorlagen laufen lokal auf Ihrer WerkHub AI Appliance. Ihre Daten verlassen niemals Ihr Netzwerk.

240+ Vorlagen auf Ihrer Hardware deployen

240+ vordefinierte Workflow-Vorlagen über 24 Branchen — anpassen, kombinieren oder eigene erstellen.

Frühzugang

Für echte Deployments entwickelt — nicht für Pitch-Decks

WerkHub AI ist für KMU gebaut, die GPT-5-Klasse-Leistung im eigenen Netzwerk brauchen. Frühzugangs-Partner erhalten persönliche Engineering-Begleitung und Preise zu heutigen Materialkosten.

5–500

Nutzer-Deployments by Design

24/7

Für Dauerbetrieb on-premise konzipiert

100 %

EU AI Act- & DSGVO-konform

Frühzugang offen

Frühzugangsprogramm jetzt offen

Die ersten 10 Kunden erhalten 12 Monate Premium-Support und eine kostenlose Discovery-Session vor Ort (bis 500 km um unseren Standort Haskovo/Sofia) — ohne Aufpreis.

12 Monate Premium-Support inklusive
Kostenlose Discovery-Session vor Ort
Preise zu aktuellen Materialkosten fixiert

Frühzugang anfragen

Fallstudie

Ein reales Deployment im Detail

Holen Sie sich das ausführliche PDF — Hardware-Spezifikationen, Integrationsansatz, QA-Prozess und Projektzeitplan eines aktuellen Builds.

Möchten Sie das detaillierte PDF mit allen Spezifikationen?

Komponentenliste, Architekturdiagramme und Projektzeitplan.

Hardware-Konfigurationen

Wählen Sie Ihre Konfiguration

Jede Appliance wird vorkonfiguriert mit dem vollständigen Software-Stack geliefert — bereit zum Einsatz in Stunden. Individuelle Konfigurationen auf Anfrage.

Basic

Plug & play

ab 2.950 €

5.900 € ohne Förderung

Blackwell (integrated)

1–10 Nutzer

3–5 simultaneous users

Konfiguration ansehen

Entry

Small business

ab 5.500 €

11.000 € ohne Förderung

2× Blackwell (integrated)

10–20 Nutzer

6–10 simultaneous users

Konfiguration ansehen

Am beliebtesten

Business

Enterprise

Maximum scale

65.000 €

Custom subsidy structuring — contact for details

4× NVIDIA RTX PRO 6000 Blackwell Max-Q

100–500 Nutzer

50–100 simultaneous users

Konfiguration ansehen

Alle Preise sind geschätzte Materialkosten + Montage. Endpreise hängen von der Konfiguration, GPU-Verfügbarkeit und aktuellen Marktbedingungen ab.
Inklusive: Hardware, vorinstallierter Software-Stack, initiale Modellbereitstellung und Setup-Dokumentation.

Staatliche Förderung

Bis zu 50 % staatliche Zuschüsse

Deutsche Förderprogramme können Ihre Investition erheblich reduzieren. Hier die wichtigsten Programme im Überblick.

Digitalbonus Bayern

Plus

bis zu 30.000 €

Fördersatz: 50 %

Zuschuss von bis zu 50 % der Digitalisierungsprojektkosten (max. 60.000 €). Deckt die gesamte KI-Lösung ab — Software, Deployment, Integration, Schulung und Appliance-Hardware.

Förderfähig: Bayerische KMU, <50 Mitarbeiter, <10 Mio. € Umsatz

Innovationsgutschein

Bayern

bis zu 49.750 €

Fördersatz: 50–60 %

Für individuelle KI-Entwicklung und Innovation. Standardstufe: bis 22.800 € (60 %). Spezialstufe: bis 49.750 € (50 %). Deckt F&E-Dienstleistungen, nicht Hardware.

Förderfähig: Bayerische KMU mit F&E-Projekten

Forschungszulage

Bundesweit

25–35 %

Fördersatz: Steuerliche Förderung

Steuerliche F&E-Förderung des Bundes. 25 % der förderfähigen Kosten (35 % für KMU), bis 1 Mio. €/Jahr. Keine Antragsfrist — wird mit der Jahressteuererklärung geltend gemacht.

Förderfähig: Alle deutschen Unternehmen, jede Größe, jedes Bundesland

Alle Förderprogramme im Detail

FAQ

Häufig gestellte Fragen

Alles, was Sie über den Einsatz von On-Premise-KI mit WerkHub AI wissen müssen.

Jede Appliance wird mit Enterprise-Komponenten geliefert, die für den 24/7-Betrieb ausgelegt sind. Wir bieten optionale Wartungsverträge mit Hardware-Austausch am nächsten Werktag. Das System nutzt RAID-Speicher, sodass ein einzelner Laufwerksausfall keinen Datenverlust verursacht. Für kritische Deployments empfehlen wir eine redundante Konfiguration.

Sie haben die volle Kontrolle über Modell-Updates. Wenn ein neues Open-Source-Modell veröffentlicht wird, stellen wir ein getestetes Update-Paket bereit, das Sie nach Belieben einspielen können — keine erzwungenen Updates, keine überraschenden Änderungen. Ihr Team kann auch eigenständig Modelle herunterladen und deployen. Wir bieten einen optionalen Managed-Update-Service, wenn Sie wartungsfreien Betrieb bevorzugen.

Ja. Die Appliance nutzt Standard-Inferenz-Frameworks (vLLM, Ollama), die jedes GGUF- oder Safetensors-Modell unterstützen. Wenn Sie feinabgestimmte Modelle aus Ihrer eigenen Trainingspipeline haben, können Sie diese direkt deployen. Wir bieten auch Fine-Tuning-Services an, wenn Sie Modelle für Ihre spezifische Domäne anpassen möchten.

Von der Bestellung bis zum voll funktionsfähigen KI-System: typischerweise 2–4 Wochen. Die Appliance wird vorkonfiguriert mit Ihren gewählten Modellen und dem Software-Stack geliefert. Die Einrichtung vor Ort dauert meist weniger als einen Tag — Strom anschließen, mit Ihrem Netzwerk verbinden, und Ihr Team kann sofort KI nutzen.

Der EU AI Act (gültig ab 2. August 2026) stuft viele geschäftliche KI-Anwendungen als Hochrisiko ein und erfordert vollständige Transparenz, Audit-Trails und Daten-Governance. Mit On-Premise-KI verlassen Ihre Daten nie Ihr Gebäude — was grenzüberschreitende Datentransferrisiken eliminiert. Sie haben die vollständige Kontrolle über Modellverhalten, Protokollierung und Compliance-Dokumentation. Wir stellen Compliance-Dokumentationsvorlagen als Teil der Bereitstellung zur Verfügung.

Jede Appliance enthält 12 Monate technischen Support für Software-Konfiguration, Modell-Deployment-Unterstützung und Fehlerbehebung. Erweiterte Supportverträge mit garantierten Reaktionszeiten sind verfügbar. Wir bieten außerdem initiale Nutzerschulung und Onboarding-Dokumentation für Ihr Team.

Für ein 100-köpfiges Team kosten Cloud-KI-Abonnements 30.000–72.000+ € pro Jahr. Die WerkHub AI Appliance ist eine einmalige Investition ab 5.900 € (ab 2.950 € mit Digitalbonus) und skaliert bis 65.000 € für Enterprise-Deployments. Minimale laufende Kosten (Strom und optionale Wartung). Die meisten Kunden sehen den vollständigen ROI innerhalb von 12–18 Monaten. Nutzen Sie unseren ROI-Rechner für einen personalisierten Vergleich.

Die Appliance läuft vollständig offline — keine Internetverbindung für die KI-Inferenz erforderlich. Das macht sie geeignet für Hochsicherheitsumgebungen. Internet wird nur benötigt, wenn Sie neue Modelle herunterladen oder Software-Updates erhalten möchten — und selbst dann können Modelle per USB für vollständig air-gapped Setups übertragen werden.

Jetzt starten

Kostenlose Beratung buchen

Erzählen Sie uns von Ihrem Team und Ihren KI-Anforderungen. Wir melden uns mit einer maßgeschneiderten Lösung, Konfigurationsempfehlung und einem Angebot.

GPT-5-Klasse KIauf eigener Hardwarebetreiben.

Für den richtigen Käufer gebaut

Geeignet für

Nicht geeignet für

Cloud-KI belastet Ihr Budget — jeden einzelnen Monat

Daten verlassen Ihr Gebäude

Unvorhersehbare Kosten

Regulatorisches Risiko

Anbieterausfälle

Enterprise-KI, die in Ihrem Serverraum lebt

NVIDIA Professional-GPUs

8B – 120B+ Parameter-Modelle

Bis zu 100 gleichzeitige Nutzer

RAG-fähige Architektur

Vorkonfiguriert & sicher

Von der Bestellung zur KI in drei Schritten

Wir konfigurieren

Wir deployen

Ihr Team nutzt KI

Vier Gründe, KI ins Haus zu holen

Datensouveränität

Planbare Kosten

Kein Vendor Lock-in

Immer verfügbar

Über 240 vordefinierte Agenten-Vorlagen — bereit für jede Abteilung

Small Business

Accountants

Finance

Ecommerce

Real Estate

Project Managers

Für echte Deployments entwickelt — nicht für Pitch-Decks

Frühzugangsprogramm jetzt offen

Ein reales Deployment im Detail

Möchten Sie das detaillierte PDF mit allen Spezifikationen?

Wählen Sie Ihre Konfiguration

Basic

Entry

Business

Enterprise

Bis zu 50 % staatliche Zuschüsse

Digitalbonus Bayern

Innovationsgutschein

Forschungszulage

Häufig gestellte Fragen

Kostenlose Beratung buchen

GPT-5-Klasse KI
auf eigener Hardware
betreiben.