Drei Ausbaustufen, mit denen wir Self-Hosted KI betreiben – von der schlanken Einstiegs-GPU bis zum Dual-GPU-Setup für die größten Modelle. Alle Konfigurationen mit 64 GB RAM und schneller NVMe-SSD.
Die Einstiegsstufe eignet sich für kompakte Modelle bis ca. 24B Parameter und schnelle Bildgenerierung. Mit zwei gekoppelten 48-GB-GPUs laufen auch die größten verfügbaren Mistral-Modelle mit über 100 Milliarden Parametern.
| Einstieg 1× GPU, 24 GB VRAM | Business 1× GPU, 48 GB VRAM | Enterprise 2× GPU, je 48 GB VRAM | |
|---|---|---|---|
| GPU | 1× GPU mit 24 GB VRAM | 1× GPU mit 48 GB VRAM | 2× GPU mit je 48 GB VRAM (96 GB gesamt) |
| RAM | 64 GB | 64 GB | 64 GB |
| Storage | 2 TB NVMe | 4 TB NVMe | 4 TB NVMe |
| Empfohlen für | Einstieg, kleine Teams, Chatbots & Textverarbeitung, schnelle Bildgenerierung | Mehrere gleichzeitige Nutzer, größere Modelle, LLM & Bildgenerierung parallel | Anspruchsvolle Workloads, größte verfügbare Modelle, maximale Qualität |
| 🧠 Reasoning | — (ab Enterprise) | — (ab Enterprise) |
Mistral Medium 3.5
Mistral Large
|
| 🛠️ Agentic / Tool-Calling |
Mistral Small 3.2
Mistral Small 3.1
Mistral Small
Mistral NeMo
Mistral (v0.3)
|
Mistral Small 3.2
Mistral Small 3.1
Mistral Small
Mistral NeMo
Mistral (v0.3)
|
Mistral Small 3.2
Mistral Small 3.1
Mistral Small
Mistral NeMo
Mistral (v0.3)
Mixtral 8x22B
|
| 💬 Einfache Chat-Modelle |
Mistral OpenOrca
MistralLite
|
Mistral OpenOrca
MistralLite
Mixtral 8x7B
|
Mistral OpenOrca
MistralLite
Mixtral 8x7B
|
| ✨ Sonder-Modelle |
Codestral
Mathstral
|
Codestral
Mathstral
|
Codestral
Mathstral
|
| FLUX-Bildmodelle |
FLUX.1 Schnell
FLUX.1 Dev
|
FLUX.1 Schnell
FLUX.1 Dev
FLUX.2 Dev
|
FLUX.1 Schnell
FLUX.1 Dev
FLUX.2 Dev
|
Modellzuordnung nach Q4-Quantisierung und tatsächlichem VRAM-Bedarf. FLUX.2 Dev (32B) empfehlen wir erst ab 48 GB VRAM für komfortablen Betrieb ohne CPU-Offload. Höhere Ausbaustufen können zusätzlich alle Modelle der darunterliegenden Stufen ausführen.
Wir beraten Sie zur passenden Hardware-Konfiguration für Ihren konkreten Anwendungsfall.
Direkter Kontakt – ohne Umwege. Wir melden uns innerhalb eines Werktages.