Ein Referenzdesign für jedes Dienstleistungsunternehmen, das verpasste Anrufe in gebuchte Termine verwandelt — und die sechs Punkte entlang eines einzelnen Anrufs, an denen die meisten Builds die Buchung leise verlieren.
Jedes Dienstleistungsunternehmen mit einem Telefon hat dasselbe Leck: Anrufe, die ankommen, wenn niemand abnehmen kann, sind Buchungen, die zur Tür hinausgehen. Ein KI-Sprachagent fängt sie auf — wenn der Pfad richtig gebaut ist. Hier ist dieser Pfad.
Der Anruf bleibt unbeantwortet und der Anbieter leitet ihn an eine Nummer weiter, die der Agent besitzt.
Ein kostengünstiger Spam-Gate wirft Junk raus, bevor er das Modell erreicht.
Eine exakte Telefonnummer-Suche sagt neu oder wiederkehrend — dann bestätigt eine Frage, wer wirklich am Apparat ist.
Ein verankerter Dialog erfasst Dienstleistung, Zeit und Kontakt — jeder Preis und jeder Slot aus einer realen Quelle, nie erfunden.
Der Termin wird erst geschrieben, nachdem eine Bestätigung greift — damit der Kalender nur echte Buchungen enthält, nichts anderes.
Bei einer Sprachlinie kostet jeder Anruf, der den Agenten erreicht, echtes Geld — Speech-to-Text, das Modell und Text-to-Speech laufen pro Anruf in der Größenordnung von ~$0,09 pro Anruf aufwärts. Die Aufgabe der Architektur ist es, diese Rechenleistung nur für plausibel echte Anrufer auszugeben und den Kalender ganz am Ende zu schützen. Stimmt die Reihenfolge nicht, zahlen Sie für Rauschen und verlieren echte Buchungen.
In Anrufreihenfolge. Jedes ist in einem Designdokument unsichtbar und wird erst offensichtlich, nachdem Sie ein paar davon ausgeliefert haben. Das Prinzip steht hier; die abgestimmten Werte und die Implementierung sind der Build.
Eine öffentliche Telefonnummer zieht Robodialer und Junk an. Schicken Sie jeden Anruf direkt ins Modell, fressen sie das Budget auf und begraben echte Anrufer — Sie zahlen pro Anruf, um mit niemandem zu sprechen.
PrinzipBlockieren Sie nach Geografie und Reputation auf Carrier-Ebene, bevor Sie überhaupt abnehmen; werfen Sie Autodialer mit einer einstufigen Challenge raus, bevor das Modell läuft; deckeln Sie die Anrufdauer; und gaten Sie die Buchung hinter einem Code, sodass Junk nie den Kalender erreicht.
"Ist das ein neuer oder wiederkehrender Kunde?" sieht aus wie eine Frage für die KI. Ist sie nicht. Retrieval ist semantisch und unscharf — richten Sie es auf Identität aus, und es wird irgendwann den falschen Datensatz matchen, mit Latenz und Kosten bei jedem einzelnen Anruf.
PrinzipIdentität ist eine exakte Telefonnummer-Suche in Ihrer Kundentabelle — deterministisch, sofort, praktisch kostenlos. Halten Sie Retrieval ausschließlich für frei formuliertes Geschäftswissen vor. Es verankert, was der Agent sagt; es entscheidet nie, wer anruft.
Die ganze Suche setzt voraus, dass der weitergeleitete Anruf immer noch die ursprüngliche Anrufer-Nummer trägt. Je nach Anbieter kann eine Nicht-Antwort-Weiterleitung stattdessen die Geschäfts-Nummer präsentieren — und dann sehen alle Anrufer gleich aus und die Identifikation versagt still für alle.
PrinzipVerifizieren Sie das Weiterleitungsverhalten an der echten Linie, bevor Sie irgendetwas darauf aufbauen — und entwerfen Sie das Unbekannte-Nummer-Fallback ohnehin, weil unterdrückte und unbekannte Nummern täglich vorkommen.
Eine erkannte Nummer ist keine verifizierte Person. Telefone werden im Haushalt geteilt und Nummern an Fremde recycelt. Begrüßen Sie, wer auch immer abnimmt, als Kontoinhaber, und Sie können die Terminhistorie eines Kunden an jemand anderen übergeben — ein unangenehmer Anruf und eine echte Datenschutzlücke.
PrinzipBehandeln Sie eine erkannte Nummer als "wahrscheinlich diese Person — bestätigen", nie als "definitiv". Eine leichte Bestätigung, bevor irgendetwas preisgegeben wird, und eine kleine Step-up-Authentifizierung nur für sensible Aktionen. Es kostet eine einzige Dialogzeile und schließt die Lücke, ohne Stammkunden zu nerven.
Die meisten Sprachfehler sind keine Modellqualität. Es ist eine verpasste Unterbrechung, ein unbestätigtes Detail oder eine halbe Sekunde tote Luft, die sich anfühlt wie "die Linie ist abgebrochen". Der Anrufer legt auf — und ein Auflegen ist eine verlorene Buchung, Punkt.
PrinzipLassen Sie Anrufer den Agenten überreden und stoppen Sie die Wiedergabe sofort. Wenn das Modell unsicher ist, fragen Sie nach oder bieten Sie Optionen, anstatt zu raten. Halten Sie ein Latenz-Budget, damit die Linie nie verstummt — und wenn es überschritten wird, erkennt der Agent das an und macht weiter, anstatt zu schweigen.
Ein Agent, der einen Preis oder einen offenen Slot erfindet, bucht Termine, die nicht existieren, und nennt Zahlen, die Sie nie festgelegt haben. Und der letzte Schritt scheitert ebenfalls leise: Anrufer zu bitten, einen per SMS gesendeten Code am Telefon vorzulesen, läuft direkt in verhörte Ziffern und eine SMS, die mitten im Anruf eintrifft.
PrinzipPreise und offene Zeiten kommen nur aus Ihren Tools — wenn ein Tool nichts zurückgibt, sagt der Agent das, statt die Lücke zu füllen. Und bestätigen Sie die Buchung so, dass sie einen Live-Anruf überlebt; einen Code per Stimme vorlesen zu lassen, ist genau die Stelle, an der Bestätigungen brechen, und es gibt ein sauberes Muster.
Diese Referenz stammt aus Sprachagenten, die in Produktion laufen, nicht von einem Whiteboard. Die Zahlen sind aus Live-Systemen.
Kein KI-Theater. Messbare Produktionsergebnisse, oder es geht nicht in Produktion.
Was oben steht, ist die Karte. Die Spam-Schwellen, die Retrieval-Schicht, die jede Antwort verankert, die Teile, die einen realen Telefonanruf überleben müssen — dort werden diese Systeme gewonnen oder verloren, und das ist, was wir tun. Bringen Sie Ihr Design oder ein leeres Blatt mit; wir härten es zu etwas, das ausgeliefert werden kann.
30-Min-Architekturgespräch buchen →