
Safety framework for AI voice agents
AI voice agents are increasingly being used in customer service, entertainment, and enterprise applications. With this shift comes the need for clear safeguards to ensure responsible use.
Notre modèle le plus rapide a désormais une prononciation des nombres améliorée
En novembre, nous avons annoncé notre nouveau modèle, le plus rapide, qui génère la parole à ≈400 ms de latence (+ latence réseau) et c'est fini deux fois plus rapide comme nos modèles V1.
Malheureusement, les utilisateurs ont constaté qu'il était difficile de prononcer les nombres longs. Écoutez cette génération de « Le prix actuel de l'action NVIDIA est de 867,49 $ : »
Aujourd'hui, nous venons de publier une prononciation améliorée des chiffres pour notre modèle Turbo v2. Voici la prononciation après le changement :
Merci à tous les utilisateurs qui ont soumis des commentaires qui ont inspiré ce correctif - et n'hésitez pas à continuer à partager les domaines dans lesquels nos modèles peuvent être améliorés.
AI voice agents are increasingly being used in customer service, entertainment, and enterprise applications. With this shift comes the need for clear safeguards to ensure responsible use.
Tips from latency-sensitive RAG systems in production
Propulsé par ElevenLabs IA conversationnelle