LONDON (IT BOLTWISE) – OpenAI hat kürzlich eine neue Funktion für ChatGPT eingeführt, die es Nutzern ermöglicht, Sprachaufnahmen anstelle von Texteingaben zu verwenden. Diese Funktion, die derzeit nur für Pro-, Enterprise- und Edu-Nutzer der macOS-Desktop-App verfügbar ist, könnte bald auch für kostenlose Nutzer zugänglich werden.

OpenAI hat eine neue Funktion namens „Record“ für ChatGPT eingeführt, die es Nutzern ermöglicht, Sprachaufnahmen zu machen, anstatt ihre Anfragen zu tippen. Diese Funktion ist derzeit auf Pro-, Enterprise- und Edu-Nutzer der macOS-Desktop-App beschränkt, könnte jedoch bald auch für kostenlose Nutzer verfügbar sein. Die Einführung dieser Funktion ist ein weiterer Schritt in Richtung einer multimodalen Nutzung von ChatGPT, die Sprache, Bild und Text in einer nahtlosen KI-Erfahrung vereint.
Die neue Record-Funktion erlaubt es Nutzern, ihre Fragen einfach zu sprechen, woraufhin ChatGPT basierend auf der Audioeingabe eine Antwort generiert. Eine schnelle Transkription des Gesagten erscheint auf dem Bildschirm, was die Interaktion klar und leicht nachvollziehbar macht. Diese Funktion ist für schnelle Anfragen auf dem Desktop konzipiert und unterscheidet sich von der vollständigen Sprachkonversation, die ChatGPT Voice bietet.
Derzeit ist die Record-Funktion auf Mac-Nutzer der ChatGPT-App beschränkt, die einen kostenpflichtigen Plan nutzen. Es ist jedoch wahrscheinlich, dass diese Funktion bald auch auf mobilen Apps und für kostenlose Konten verfügbar sein wird. Dies passt perfekt in OpenAIs Strategie, ChatGPT zu einem umfassenderen KI-Assistenten zu machen, der Sprache, Vision und Text kombiniert.
Die Konkurrenz schläft nicht: Google Gemini Live unterstützt bereits Echtzeit-Sprachinteraktion auf Android und iOS. Wenn OpenAI möchte, dass ChatGPT diese Nutzbarkeitsebene erreicht, insbesondere auf mobilen Geräten, ist es sinnvoll, die Record-Funktion für mehr Nutzer zugänglich zu machen.
Seit der Einführung von ChatGPT Voice für mobile Geräte, die ich getestet und als äußerst nützlich empfunden habe, ist der nächste logische Schritt die Record-Funktion. Diese unterscheidet sich jedoch von ChatGPT Voice, da sie eher wie eine KI-Transkriptions-App funktioniert. Sie ist schnell, leichtgewichtig und eignet sich gut für schnelle Interaktionen, wenn man keine vollständige Konversation führen möchte.
Da multimodale Fähigkeiten nun ein entscheidendes Schlachtfeld im Bereich der KI-Assistenten sind, ist zu erwarten, dass OpenAI weiterhin Funktionen wie Record ausbauen wird. Indem man Nutzern der kostenlosen Stufe einen Vorgeschmack auf diese Tools gibt, kann man Loyalität aufbauen und möglicherweise Upgrades auf kostenpflichtige Pläne fördern.
Für den Moment sollten Nutzer von ChatGPT Pro, Enterprise oder Edu auf einem Mac nach dem neuen Mikrofon-Symbol neben dem Chat-Feld Ausschau halten, um den Record-Modus auszuprobieren. Wenn Sie keinen kostenpflichtigen Plan haben, halten Sie Ausschau; diese Funktion könnte bald für die breitere ChatGPT-Nutzerbasis verfügbar sein.


- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Technical Product Owner (gn) AI

Abschlussarbeit/Pflichtpraktikum: Risikobewertung maritimer KI-Systeme (m/w/d)

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

Senior Full-Stack Developer (m/w/d) AI Powered News Startup (Webentwickler | Webdeveloper)

- Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "ChatGPTs neue Sprachfunktion: Ein Schritt in Richtung Multimodalität" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "ChatGPTs neue Sprachfunktion: Ein Schritt in Richtung Multimodalität" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »ChatGPTs neue Sprachfunktion: Ein Schritt in Richtung Multimodalität« bei Google Deutschland suchen, bei Bing oder Google News!