KI-Systeme im Produktivbetrieb. Echte Zahlen, echte Kunden.

Fallstudien aus Live-Deployments — Voice Agents nehmen Anrufe entgegen, Chatbots leiten Support-Anfragen um, Agenten reaktivieren Kunden, Enterprise-RAG über berechtigungsgesteuerte Dokumentbestände. Jede Kennzahl stammt aus dem Produktivbetrieb, nicht aus einer Demo-Umgebung. NDAs werden eingehalten, wo erforderlich; Architekturentscheidungen werden offen geteilt.

Voice Agents Chatbots KI-Agenten RAG Evaluation HIPAA

Voice Agent · Gastronomie · NYC

Milina — KI-Voice-Agent für ein New Yorker Restaurant für 0,09 $ pro Anruf

50+ Reservierungen pro Nacht, zweisprachig (Englisch + Spanisch), Antwortlatenz unter 700 ms. LiveKit + Deepgram + GPT-4o-mini + Cartesia. Anrufende bemerken in der Regel nicht, dass sie mit einem KI-Agenten sprechen.

LiveKitDeepgram Nova-2GPT-4o-miniCartesiaResyToast POS

91 %Aufgabenabschluss

0,09 $Pro Anruf

+22 %Buchungen MoM

<700 msp50-Latenz

Milina-Fallstudie lesen → Voicemail-ASR · Schweizer B2B-Food · Schwyzerdütsch

Schweizerdeutsche Voicemail → strukturierte Bestellungen für einen Lebensmittelgroßhändler

Drei-Modell-Ensemble (Whisper Turbo + Gemini 2.5 Pro + FHNW Schweizerdeutsch) mit Claude 4.7 Opus als Arbiter. Beendet Whispers Looping-Halluzinations-Fehlermodus auf 796 Telefon-Voicemails. 99 von 100 zuvor unbrauchbaren Dateien wiederhergestellt.

Whisper TurboGemini 2.5 ProFHNW Swiss GermanClaude 4.7 OpusFastAPIDocker

99/100Dateien gerettet

0Looping-Halluz.

~15 $Gesamt, 796 Dateien

3×vs. Swiss Fine-Tune

Schweizerdeutsch-Fallstudie lesen → Voice Agent · HIPAA · Zahnarztpraxis

CleverAnswerAI — HIPAA-konformer Zahnarzt-Empfang, 20+ Praxen

Selbst gehostetes LiveKit auf einem BAA-konformen Stack, seit einem Jahr im Einsatz. 100 % Erreichbarkeit. 28 % mehr Neupatienten-Buchungen. Direkte Integration mit Dentrix, Open Dental, Curve und Eaglesoft.

LiveKit (self-hosted)Deepgram EnterpriseAzure OpenAIElevenLabs EnterpriseDentrix

100 %Erreichbarkeit

+28 %Neubuchungen

20+Praxen

CleverAnswerAI-Fallstudie lesen → LLM-Evaluation · iGaming

iGaming QA — von 66 % auf 91 % durch schema-gesteuertes Reasoning

Die QA-Genauigkeit eines Tier-1-Betreibers wurde von 66 % auf 91 % und die Abdeckung von 2 % auf 25 % gesteigert. Rubrik als Code, Evaluation-Harness mit 1.200 Testfällen, Zwei-Modell-Ensemble für regulatorische Kriterien.

GPT-4oClaude Sonnet 3.5LangGraphLangSmithPydantic

66→91 %Genauigkeit

2→25 %Abdeckung

0,04 $Pro Prüfung

iGaming-QA-Fallstudie lesen → KI-Agent · Einzelhandel · Reaktivierung

Reinigungskette — KI-Reaktivierungsagent, 3,5-facher ROI

192.000 Kunden × Kategorie-Intervalle täglich bewertet. LangGraph-Agent wählt Kanal, Nachricht, Angebot und Zeitpunkt individuell pro Kunde. 18,7 % Reaktivierungsrate über 23 Behandlungskategorien.

LangGraphGPT-4oTwilio SMSWhatsApp Businessn8n

3,5xROI vs. Kontrollgruppe

18,7 %Reaktivierung

60+Standorte

Reaktivierungs-Fallstudie lesen → Call-QA · Sales Ops · B2B SaaS

ConvoTune — KI-Gesprächstranskription & -bewertung für ein 40-köpfiges Vertriebsteam

Monatlich werden 3.000+ Anrufe anhand eines 30-Punkte-Playbooks bewertet. 89 % Übereinstimmung mit menschlichen Prüfenden. Echtzeit-Coaching-Hinweise in unter 300 ms. Gesamte Pipeline im AWS-Umfeld des Kunden.

Whisper fine-tunedDeepgram Nova-2Azure OpenAILangGraphTerraform

3.000+Anrufe/Monat

89 %Bewertungsübereinstimmung

34 $Pro Platz/Monat

ConvoTune-Fallstudie lesen → Enterprise RAG · UK-Bau · NDA

Unternehmens-RAG — ~500 interne Nutzer, berechtigungsgesteuert

Eine UK-Gruppe für Bauinstandsetzung, Wartung und Sanierung (unter NDA). Berechtigungsgesteuertes RAG über SharePoint mit AWS Kendra + Bedrock + OpenFGA + Keycloak. Dokumentensuche kollabierte von ~15 Minuten auf Sekunden (~150× schneller).

AWS BedrockAWS KendraOpenFGAKeycloakNestJS 11Lambda

~150×Schnellere Suche

~500Interne Nutzer

30+Use Cases

Unternehmens-RAG-Fallstudie lesen → Multi-Tenant RAG · DE · NDA

Deutsche technische RAG — als das Framework nicht reichte

Zwei deutsche Mandanten (unter NDA): ein Hersteller von Betonprodukten und ein regionaler kommunaler Wasserversorger. Wir haben das Standard-RAG-Framework gelöscht und eine eigene Single-Orchestrator-Pipeline (rag2) geschrieben. DIN-/EN-/DWA-Normen pro Chunk erhalten.

OpenAI EmbeddingsPinecone v6bm25smmarco-mMiniLMv2DoclingFlask

2Mandanten live

0DAG-Frameworks

23+Gold-Eval-Fälle

Deutsche technische RAG-Fallstudie lesen →

Ältere Projekte

Frühere Forschung und Datenplattform-Fallstudien.

Vor den kommerziellen RAG-Projekten haben wir einen offenen RAG-Benchmark-Write-up veröffentlicht und Daten-Stacks auf Basis von dbt, Snowflake und arabischsprachig optimierten Analytics-Plattformen aufgebaut. Diese Projekte generieren für die betreffenden Kunden weiterhin Mehrwert — und wir übernehmen selektives Analytics Engineering für bestehende KI-Kunden — sie stehen jedoch nicht mehr im Mittelpunkt unserer Leistungen.

Archiv

Ältere Write-ups bleiben zur Referenz online: Enterprise RAG Challenge — Sieger-Architektur, Fitnessstudio-Analytics, Datenplattform für medizinische Ästhetik, Analytics für Premium-Kliniken. Diese Seiten bleiben erreichbar, sind aber nicht mehr in unserer aktuellen Navigation aufgeführt.

Ihre Fallstudie als Nächstes

Möchten Sie ähnliche Ergebnisse erzielen? Lassen Sie uns prüfen, ob Ihr Anwendungsfall umsetzbar ist.

Ein 20-minütiges Gespräch. Teilen Sie uns Ihr Anrufvolumen, Ihren Tech-Stack oder Ihre aktuelle Konversionsrate mit — wir sagen Ihnen ehrlich, ob wir es umsetzen können, wie die Architektur aussieht und was es kosten wird.

Erstgespräch buchen → Preise ansehen