§ 03 / Voice-Agents
Home / Leistungen / Voice-Agents
Update 2026

Kein verpasster
Anruf.
Nie wieder.

Unsere Voice-Agents klingen wie echte Menschen — mit deutscher Stimme auf Basis von ElevenLabs und KI-Logik aus Retell AI. Sie nehmen Anrufe an, verstehen Anliegen, buchen Termine im Kalender, leiten weiter wenn nötig.

Kernfunktionen

// Natürliche Stimme
// Kalender-Sync
// CRM-Anbindung
// 24/7 verfügbar

Stimme
ElevenLabs
Engine
Retell AI
Latenz
<800ms
Sprachen
DE/EN
§ 01 / Use Cases

Wo ein Voice-Agent sofort Sinn ergibt.

Typische Szenarien
01

Handwerksbetrieb

Meister ist auf der Baustelle, Büro unbesetzt. Der Voice-Agent nimmt das Gespräch an, notiert Namen, Adresse, Problem, bucht einen Termin-Vorschlag.

02

Arzt- / Zahnarztpraxis

Keine Warteschleifen mehr. Termin buchen, absagen, verschieben — der Voice-Agent schaut live in den Kalender und bestätigt.

03

Dienstleister & Beratung

Lead-Qualifizierung direkt am Telefon. Nur qualifizierte Anfragen werden an dein Team durchgestellt — alles andere wird transkribiert.

§ 02 / Pakete

Drei Tiers.

Netto · §19 UStG
Tier 01 / Starter

Starter

Dein KI-Telefonassistent. Nimmt Anrufe an. Keine verpassten Anfragen.

1.999 einmalig
+ 149 € / Monat · inkl. 200 Minuten
  • Deutsche Stimme (ElevenLabs)
  • Beantwortet Standard-Anfragen
  • Nimmt Nachrichten auf
  • Weiterleitung bei Bedarf
  • Transkripte per E-Mail
  • Rufumleitung, 24/7 verfügbar
Anfragen
Tier 03 / Enterprise

Enterprise

Outbound-Kampagnen, Dialog-Flows, komplexe Systeme.

6.999 einmalig
+ 549 € / Monat · inkl. 1.500 Minuten
  • Alles aus Profi
  • Outbound-Anruf-Kampagnen
  • Mehrere Voice-Agents parallel
  • Custom Dialog-Flows
  • ERP- & Produktionssystem-Integration
  • 24/7 Hot-Standby
  • Dedicated Success-Manager
Anfragen
§ 03 / Einsatzfelder

Wo Voice-Agents den Unterschied machen.

Use Cases
/01

Arztpraxen

Terminbuchung, Rezeptverlängerung, Krankmeldung — ohne dass die MFA permanent am Hörer ist. 90 % Termine laufen automatisch.

/02

Handwerksnotdienst

Nachts, Wochenende, Feiertag — der Agent nimmt ab, qualifiziert den Notfall, priorisiert Dringlichkeit und leitet bei echten Notfällen weiter.

/03

Restaurants & Hotels

Reservierungen, Zimmeranfragen, Öffnungszeiten, Allergien. Nimmt mehr Anrufe an, als ein Team je könnte.

/04

Kanzleien

Erstgespräch-Qualifizierung: Mandatsart, Dringlichkeit, Gegner, Zeitrahmen. Der Agent dokumentiert, der Anwalt ruft vorbereitet zurück.

/05

Kunden-Support

Bestellstatus, Retouren, technische Basisfragen. 70 % der Anrufe werden ohne menschliches Eingreifen gelöst.

/06

Outbound / Rückrufe

Nachhaken bei offenen Angeboten, Terminbestätigung, Follow-up nach dem Besuch. Höflich, ausdauernd, nie genervt.

§ 04 / Tech-Stack

Was unter der Haube steckt.

Infrastruktur
Voice-Plattform

Retell AI & ElevenLabs

Für die Telefon-Infrastruktur setzen wir auf Retell AI — derzeit die Plattform mit den niedrigsten Latenzen für deutschsprachige Gespräche. Stimmen kommen über ElevenLabs (multilingual-v2 Modell), optional auch eigene geklonte Stimmen.

Als Alternative bieten wir Vapi — je nach Anwendungsfall.

KI-Brain
  • Modell: Claude (Dialogverständnis) + GPT-4 (Fallback)
  • Spracherkennung: Deepgram nova-3 · multilingual
  • TTS (Sprachausgabe): ElevenLabs · mehr als 30 deutsche Stimmen
  • Latenz: < 700 ms End-to-End (wahrnehmbar "natürlich")
  • Telefonnummer: eigene DE-Nummer (Festnetz oder Mobil)
  • Anrufaufzeichnung: optional, DSGVO-konform mit Einwilligung
  • Integrationen: wie bei Chatbots (Kalender, CRM, E-Mail, Slack)
§ 05 / Ablauf

Von Brief bis Echtbetrieb.

6 Wochen
01

Briefing

Welche Gespräche soll er führen? Welchen Ton hat dein Betrieb? Was ist Eskalationspfad? Wir hören eine Woche lang in echte Anrufe rein.

// Woche 1

02

Gesprächs-Design

Dialog-Flows, Prompts, Eskalations-Trigger. Wir designen den "Charakter" des Agents — nicht roboterhaft, nicht zu plaudrig.

// Woche 2-3

03

Testbetrieb

Du und Kollegen rufen an, testen, geben Feedback. Wir schleifen Formulierungen, Tempo, Eskalationen nach. Mind. 200 Testanrufe.

// Woche 4-5

04

Live-Schaltung

Rufumleitung einrichten. Monitoring der ersten 100 echten Anrufe. Finetuning. Nach Woche 6 läuft er allein.

// Woche 6

§ 06 / FAQ

Häufig gefragt.

Voice-Agents

Stand 2026: Ungeübten Ohren fällt es nicht auf. Wir empfehlen trotzdem aus Transparenzgründen, den Agent zu Beginn sagen zu lassen: "Ich bin Lisa, der digitale Assistent von [Firma]". Das schafft Vertrauen und erfüllt aktuelle Empfehlungen der DSK zur KI-Kennzeichnung.

Wir bauen klare Eskalationspfade ein: Bei Wortmustern wie "ich will jemand Echtes sprechen", aggressivem Ton, medizinischem Notfall oder nach 2 Missverständnissen wird sofort an eine hinterlegte Handynummer weitergeleitet — oder, falls besetzt, ein Rückruf mit vollständiger Mitschrift versprochen.

Hochdeutsch mit leichtem Dialekt-Einschlag: ja (Bayerisch, Österreichisch, Schweizerdeutsch in akzeptabler Qualität). Starken Dialekt (tiefes Bairisch, Schwäbisch, Wienerisch): eingeschränkt. Wir testen im Raum deiner Kunden ausgiebig, bevor wir live gehen.

Gesundheitsdaten unterliegen Art. 9 DSGVO. Wir konfigurieren den Agent so, dass er keine Diagnosen, Medikamentennamen oder Krankheitsbilder im Klartext abspeichert. Er kann "Ich brauche einen Termin wegen Rückenschmerzen" hören und verarbeiten, aber das Feld in der Terminbuchung heißt dann nur "Grund", nicht das Original-Zitat.

Im Profi-Tier (3.499 € + 299 €/Mo) sind 500 Minuten/Monat inkludiert. Darüber kostet die Minute 0,15 € netto. Für die meisten Handwerksbetriebe und Praxen reicht der Profi-Tier völlig aus.

Nach jedem Gespräch landet eine Zusammenfassung in deinem Slack, E-Mail und CRM: Wer hat angerufen, was war das Anliegen, was wurde vereinbart, welche Daten wurden ausgetauscht. Die vollständige Transkription kann optional eingesehen werden — für 30 Tage archiviert, dann gelöscht (DSGVO-Konformität).

Nächster Schritt

Reden wir
über dein Projekt.

30 Minuten. Kostenlos. Keine Verkaufsshow. Am Ende weißt du, was möglich ist — und was es wirklich kostet.