Audio-Eingabe
Nehmen Sie Sprachnachrichten direkt in der Chat-Oberfläche auf und transkribieren Sie sie mit Echtzeit-Sprache-zu-Text.
Nehmen Sie Sprachnachrichten direkt in der Chat-Oberfläche über die integrierte Mikrofon-Funktionalität auf. agao konvertiert Ihre gesprochenen Worte automatisch in Textnachrichten und ermöglicht so eine freihändige Kommunikation mit KI-Modellen. Diese Funktion optimiert den Gesprächsfluss und ermöglicht natürliche Sprachinteraktionen.
Voraussetzungen
Die Verfügbarkeit der Audio-Eingabe hängt von der spezifischen agao-Instanz-Konfiguration und den Benutzerberechtigungen ab. Ein Transkriptionsmodell muss in Ihrer agao-Instanz konfiguriert sein, und Ihre Benutzergruppe muss die entsprechenden Berechtigungen für den Zugriff auf Sprachaufnahmefunktionen haben. Wenn diese Anforderungen erfüllt sind, sehen Sie eine Mikrofon-Schaltfläche im Chat-Eingabebereich.
Browser-Berechtigungen
Wenn Sie zum ersten Mal versuchen, die Audio-Eingabe zu verwenden, wird Ihr Browser um Erlaubnis bitten, auf Ihr Mikrofon zuzugreifen. Sie müssen diese Berechtigung gewähren, damit die Funktion funktioniert. Dies ist eine Standard-Browser-Sicherheitsmaßnahme, die sicherstellt, dass Websites nur mit Ihrer ausdrücklichen Zustimmung auf Ihr Mikrofon zugreifen können.
Aufnahmeprozess
Klicken Sie auf die Mikrofon-Schaltfläche im Chat-Eingabefeld, um mit der Aufnahme Ihrer Sprachnachricht zu beginnen. Während der Aufnahme können Sie natürlich sprechen - das System erfasst Ihr Audio in Echtzeit. Sprechen Sie weiter, bis Sie Ihre Nachricht beendet haben, und klicken Sie dann auf die Stopp-Schaltfläche, um die Aufnahmesitzung zu beenden.
Transkription und Übermittlung
Sobald Sie die Aufnahme stoppen, transkribiert agao automatisch Ihr Audio mit dem konfigurierten Sprache-zu-Text-Modell. Der transkribierte Text erscheint als reguläre Chat-Nachricht und wird zur Verarbeitung an das KI-Modell gesendet. Diese nahtlose Konvertierung ermöglicht es Ihnen, mit KI-Modellen über natürliche Sprache zu interagieren, während das standardmäßige textbasierte Gesprächsformat beibehalten wird.
Der Transkriptionsprozess dauert in der Regel nur wenige Sekunden, und die resultierende Nachricht integriert sich natürlich in Ihren Gesprächsfluss. Audio-Eingabe-Nachrichten werden bei der KI-Verarbeitung und Antwortgenerierung identisch zu getippten Nachrichten behandelt.