Elevenlabs, ein führendes Unternehmen im Bereich der künstlichen Intelligenz für Sprache, hat sein neuestes Text-zu-Sprache-Modell, Eleven v3 (alpha), veröffentlicht. Dieses fortschrittliche Modell verspricht eine deutlich verbesserte Ausdrucksfähigkeit, präzisere Kontrolle über die Sprachausgabe und eine erweiterte Sprachunterstützung für über 70 Sprachen. Die neue Version ist ab sofort über die API zugänglich und eröffnet neue Möglichkeiten für Entwickler und Kreative.
Hauptmerkmale von Eleven v3 (alpha)
- Erweiterte Ausdrucksmöglichkeiten: Das Modell ermöglicht eine natürlichere und nuanciertere Sprachwiedergabe.
- Dialogmodus: Eine bedeutende Neuerung ist die Einführung eines Dialogmodus, der die Generierung von Gesprächen mit beliebig vielen Sprechern unterstützt.
- Emotionale Steuerung: Nutzer können Emotionen und Stimmcharakteristika mithilfe von Audiotags präzise steuern, was eine tiefere emotionale Ebene in die Sprachausgabe bringt.
- Umfassende Sprachunterstützung: Mit über 70 unterstützten Sprachen wird die globale Anwendbarkeit des Modells erheblich erweitert.
Zugang und Nutzung
Die Nutzung der Eleven v3 (alpha) API ist für Anwender mit einem kostenlosen Konto möglich. Für den Zugriff auf zusätzliche Funktionen können jedoch kostenpflichtige Tarife erforderlich sein. Detaillierte technische Informationen und praktische Anwendungsbeispiele sind in der offiziellen Dokumentation von Elevenlabs verfügbar. Ein einfacher Einstieg wird durch eine kostenlose Anmeldung ermöglicht, die den Nutzern erlaubt, die neuen Fähigkeiten des Modells direkt zu erkunden und zu testen.