OpenAI hat bei einem Live-Event am 13. Mai 2024 das neue ChatGPT-4o vorgestellt, das bahnbrechende Verbesserungen und neue Funktionen für alle Nutzer, auch in der kostenlosen Version, mit sich bringt.
Die neuen Fähigkeiten von GPT-4o werden in den nächsten Wochen schrittweise für alle Nutzer ausgerollt. Damit können sich sowohl Privatanwender als auch Unternehmen schon bald von den Vorteilen des neuen Modells überzeugen. OpenAI verspricht eine deutlich natürlichere Interaktion, schnellere Reaktionszeiten und eine verbesserte Verarbeitung von Sprache, Text und Bildern.
Dieser Blogbeitrag zeigt die wichtigsten Neuerungen in der Übersicht:
GPT-4o: Ein Omnimodell für Text, Sprache und Bild
Das Herzstück des Updates ist das neue GPT-4o Modell. Das “o” steht dabei für “omni” und bedeutet, dass GPT-4o ein multimodales Modell ist, das Text, Sprache und Bilder gleichzeitig verarbeiten kann. Bisher wurden dafür separate Modelle verwendet, was zu Verzögerungen führte. GPT-4o vereint nun alles “nativ” in einem Modell. Dadurch werden Gespräche mit ChatGPT deutlich natürlicher und flüssiger, was sich in den folgenden Features widerspiegelt:
- Nutzer können das neue ChatGPT-4o jetzt jederzeit unterbrechen und direkt weitersprechen, ohne auf eine Antwort warten zu müssen
- ChatGPT reagiert in Echtzeit auf das Gesagte und passt seine Antworten dynamisch an
- Emotionen und Stimmungen in der Stimme des Nutzers werden erkannt und interpretiert
- ChatGPT kann selbst mit unterschiedlichen Emotionen, Betonungen und Stimmlagen antworten, um natürlicher zu wirken
- Sogar Singen ist jetzt möglich – ChatGPT kann auf Wunsch Antworten melodisch vortragen
Erweiterte Fähigkeiten jetzt kostenlos verfügbar
Viele der bisher kostenpflichtigen Funktionen von ChatGPT Plus sind mit GPT-4o nun auch in der kostenlosen Version verfügbar:
- Websuche: Das neue ChatGPT-4o kann jetzt auch auf Informationen aus dem Internet zugreifen
- Datei-Upload: Nutzer können Dateien und Bilder hochladen, die ChatGPT dann zusammenfasst oder analysiert
- Datenanalyse: ChatGPT kann Daten auswerten und Diagramme erstellen
- Speicher: ChatGPT merkt sich Kontext aus vorherigen Konversationen
- GPT Store: Nutzer bekommen Zugriff auf von der Community erstellte ChatGPT-Anwendungen
Es gibt allerdings ein Limit, wie viele Anfragen freie Nutzer mit GPT-4o stellen können. Ist es erreicht, wird automatisch das ältere GPT-3.5 Modell verwendet. Bezahlte Nutzer haben ein 5-fach höheres Limit.
Erweiterte Bildanalyse-Fähigkeiten
Auch bei der visuellen Erkennung hat das neue ChatGPT-4o grosse Sprünge gemacht:
- Hochgeladene Fotos und Screenshots können in Echtzeit analysiert und diskutiert werden.
- ChatGPT erkennt Objekte, Personen, Text, Handschrift und sogar Code auf Bildern.
- Praktische Anwendungen sind z.B. das Übersetzen von fremdsprachigen Speisekarten oder das Identifizieren von Kleidungsstücken.
Durch die Integration der Bildanalyse ergeben sich völlig neue Möglichkeiten, ChatGPT im Alltag zu nutzen. Mit GPT-4o macht OpenAI einen grossen Schritt, um ChatGPT intuitiver, leistungsfähiger und einem menschlichen Gesprächspartner noch ähnlicher zu machen. Dass viele der Premium-Funktionen nun kostenlos sind, unterstreicht das Ziel, fortschrittliche KI für die breite Masse verfügbar zu machen.
Neue Desktop-App und Benutzeroberfläche
Um die Nutzung von ChatGPT noch komfortabler zu gestalten, hat OpenAI eine dedizierte Desktop-Applikation entwickelt. Zunächst für Mac-Benutzer verfügbar und später auch für Windows ermöglicht diese Anwendung die Offline-Nutzung der KI und bietet eine nahtlose Integration in die Desktop-Umgebung. Benutzer können so produktiver arbeiten und von erhöhter Sicherheit profitieren.
Verbesserte API für Entwickler
Die GPT-4o API bietet Entwicklern bedeutende Vorteile. Sie ist doppelt so schnell und 50% günstiger als die GPT-4 API, was effizientere Verarbeitung und Kostenersparnis ermöglicht. Höhere Ratenlimits erlauben die Verarbeitung von mehr Anfragen in kürzerer Zeit, was skalierbarere Anwendungen ermöglicht. Entwickler, die mit GPT-4o experimentieren möchten, erhalten Zugang zur API. OpenAI plant jedoch, die neuen Audio-Funktionen zunächst nur einer kleinen Gruppe vertrauenswürdiger Partner zur Verfügung zu stellen, um möglichen Missbrauch zu vermeiden.
Fazit
Das neue ChatGPT-4o markiert einen bedeutenden Schritt nach vorn in der Welt der Konversations-KI. Mit kostenloser Verfügbarkeit, multimodaler Interaktion, schnellerer Verarbeitung, erweiterter Zugänglichkeit, nahtloser Desktop-Integration und verbesserter API setzt OpenAI neue Massstäbe für die Zukunft der Mensch-KI-Interaktion. Es bleibt spannend zu beobachten, wie diese revolutionäre Technologie unsere Art zu kommunizieren, zu lernen und zu arbeiten verändern wird.
Die vollständige Spring Update Keynote von OpenAI inklusive sämtlicher Demos können Sie sich hier anzuschauen: https://www.youtube.com/watch?v=DQacCB9tDaw&t=961shttps://lnkd.in/eXtvq39H