Frühjahrs-Update: Naoma Agent V2 mit Conva

9. Juni 2026 · 5 Min. Lesezeit · Aktualisiert 9. Juni 2026

Frühjahrs-Update: Naoma Agent V2 mit Conva

Naoma Agent V2 ist für alle Kunden live — eine neu entwickelte Voice-Engine (Conva) mit geringerer Latenz, besserem Umgang mit Unterbrechungen und voller Kontrolle über die Demo.

In diesem Frühjahr haben wir das größte Upgrade seit dem Start von Naoma ausgeliefert: Agent V2, der auf unserer eigenen Voice-Engine Conva läuft. Er ist ab sofort für jeden aktiven Kunden live — und macht unsere Live-KI-Demos schneller, natürlicher im Gespräch und deutlich besser steuerbar.

Im Folgenden lesen Sie, was sich geändert hat und warum das den Unterschied macht.

Das Wichtigste in Kürze

  • Naoma Agent V2 ist für alle Kunden live — ohne Migrationsaufwand auf Ihrer Seite.
  • Er läuft auf Conva, unserer selbst entwickelten, selbst gehosteten Voice-Engine.
  • Geringere Latenz — der Agent antwortet nahezu in Echtzeit, sodass sich eine Demo wie ein Gespräch anfühlt und nicht wie ein Funkgerät.
  • Besserer Umgang mit Unterbrechungen — Interessenten können einhaken, die Richtung wechseln und mitten im Satz nachfragen, und der Agent bleibt mühelos dran.
  • Echte Kontrolle über die Voice-Schleife — wir verantworten nun jede Stufe selbst, also liegen Verhalten, Leitplanken, Personalisierung und Sprachen vollständig in unserer Hand.
  • Für Skalierung gebaut — der neue Stack ist unter Last zuverlässiger und wirtschaftlich tragfähig, während das Demo-Volumen wächst.
  • In der Praxis bewährt — Naoma hat inzwischen 3,000+ Live-KI-Demos durchgeführt, mit einem durchschnittlichen CSAT von 4.7/6.

Warum wir die Engine neu gebaut haben

Eine Live-Demo ist das Anspruchsvollste, was ein KI-Agent leisten kann. Bei einem Chatbot fällt eine Sekunde Bedenkzeit niemandem auf. Ein Voice-Agent dagegen, der zögert, dem Interessenten ins Wort fällt oder sich nicht unterbrechen lässt, zerstört die Illusion auf der Stelle — und eine missglückte Demo kostet Sie den Abschluss.

In unserer ersten Generation haben wir die Voice-Pipeline auf einem konversationellen Stack eines Drittanbieters aufgesetzt. Das brachte uns schnell live, blieb aber eine Blackbox: Wir konnten Timing, Sprecherwechsel und das Verhalten des Agenten in genau den Grenzfällen, auf die es im Verkaufsgespräch wirklich ankommt, nicht vollständig steuern. Als wir über die Marke von 3,000+ Live-Demos hinauswuchsen, wurden die Grenzen offensichtlich — sowohl im Erlebnis als auch bei den Kosten.

Also haben wir den Kern selbst neu entwickelt. Conva ist eine selbst gehostete Engine, die die gesamte Voice-Schleife — Zuhören, Verstehen und Antworten — unter einem Dach betreibt, das wir Ende zu Ende kontrollieren.

Geringere Latenz

Der entscheidende Faktor dafür, ob sich eine Voice-Demo menschlich anfühlt, ist die Antwortlatenz — die Lücke zwischen dem Moment, in dem der Interessent seinen Satz beendet, und dem Moment, in dem der Agent zu antworten beginnt. Weil wir die gesamte Pipeline selbst verantworten, konnten wir die Übergaben und den Overhead zwischen den Stufen reduzieren — V2 antwortet daher spürbar schneller.

Dieses Tempo zahlt sich doppelt aus. Die ersten 60 Sekunden einer Demo entscheiden, ob ein Besucher bleibt oder abspringt, und es ist gerade das flüssige Hin und Her, das diese Sekunden zu einem echten Gespräch macht — statt zu einer Präsentation mit Verzögerung.

Erlebe es in Aktion — sprich mit Naoma

KI-Demo-Agent, der 6–20 % der Besucher konvertiert. Jetzt ausprobieren.

Besserer Umgang mit Unterbrechungen

Echte Interessenten warten nicht höflich ab, bis der Agent ausgeredet hat. Sie haken ein: „Überspring das", „Moment, geh nochmal zurück", „Lässt sich das in unser CRM integrieren?" V1 kam dabei ins Stolpern. V2 ist genau dafür gebaut.

Dank direkter Kontrolle über die Spracherkennung und den Sprecherwechsel meistert Agent V2 das Dazwischenreden souverän — er stoppt, hört zu und passt sich an, wohin der Interessent das Gespräch lenken will. Das Ergebnis: eine Demo, die der Interessent steuert — genau so, wie die besten menschlichen Demos funktionieren.

Echte Kontrolle über die Voice-Schleife

Das ist der Teil, der für Interessenten unsichtbar bleibt, für uns — und für Sie — aber am meisten zählt. Weil Conva jede Stufe der Pipeline verantwortet, können wir an Stellschrauben drehen, an die uns eine Blackbox nie herangelassen hätte:

  • Verhalten und Leitplanken — wie der Agent eine Demo taktet, wann er qualifiziert, wann er übergibt und wie er bei der Sache bleibt.
  • Personalisierung — Anpassung der Demo daran, wer gerade zusieht und woher er kommt.
  • Sprachen — gleichbleibende Qualität über alle 33 languages, die Naoma spricht.
  • Zuverlässigkeit — weniger bewegliche Teile außerhalb unserer Kontrolle bedeuten weniger Möglichkeiten, dass eine Live-Demo scheitert.

Kurz gesagt: Das Demo-Erlebnis liegt jetzt in unserer Hand und lässt sich schnell verbessern — statt auf die Roadmap eines anderen zu warten.

Für Skalierung gebaut

Beim Self-Hosting der Engine ging es nicht nur um Qualität. Ein konversationeller Blackbox-Stack eines Drittanbieters trägt nicht — weder technisch noch wirtschaftlich —, sobald man Demos in großem Umfang über viele Kunden hinweg ausliefert. Conva gibt uns einen Stack, der unter Last stabil bleibt und dessen Stückkosten mit unserem Wachstum aufgehen. Genau das erlaubt es uns, V2 ohne Kompromisse an jeden Kunden auszurollen.

Und dieser Rollout ist abgeschlossen: Agent V2 läuft bereits in jedem aktiven Naoma-Deployment — als Teil der 3,000+ Live-KI-Demos, die Naoma inzwischen durchgeführt hat, bei einem durchschnittlichen CSAT von 4.7/6. Wenn Sie Naoma auf Ihrer Website nutzen, sind Sie heute schon auf V2 — nichts zu installieren, nichts zu migrieren.

Fazit

Agent V2 macht das, was Interessenten tatsächlich erleben — die Live-Demo — schneller, natürlicher und zuverlässiger und gibt uns zugleich die volle Kontrolle, um sie weiter zu verbessern. Er ist ab sofort für alle live.

Am besten spüren Sie den Unterschied, wenn Sie selbst mit ihm sprechen. Erleben Sie eine Live-KI-Demo oder entdecken Sie die Naoma-Preise, wenn Sie bereit sind, V2 auf Ihrer eigenen Website einzusetzen.

Naoma AI

Hör auf, über Demos zu lesen.
Erlebe eine.

Naoma führt personalisierte Produktdemos rund um die Uhr in 33 Sprachen durch. Überzeuge dich selbst in unter 2 Minuten.