Inhalt
(16.05.2024 - Stichwort: ChatGPT, GPT-4o)
Es gab viele Gerüchte, was OpenAI, der Anbieter von ChatGPT veröffentlichen wird. Die Spekulationen reichten von GPT-5 bis hin zu einer eigenen Suchmaschine. Jetzt wissen wir es und es gibt eine Menge Änderungen. Welche das sind, erfährst du gleich.
Hinweis: nicht alle Dinge sind sofort verfügbar, werden aber in den nächsten Wochen nutzbar sein.
Meine Bücher zum Thema KI: Ob du gerade erst mit KI startest oder deine Routine mit praxisnahen Übungen verbessern möchtest – hier findest du das passende Buch.


GPT-4o ist veröffentlicht und kann im Chat neben den anderen Sprachmodellen ausgewählt werden. Das „o“ steht für „omni“. Es handelt sich um eine Weiterentwicklung von GPT-4 und beinhaltet folgende Neuerungen:
GPT-4o soll jetzt wesentlich schneller antworten. Erreicht wird das durch die Komprimierung des neuen Tokenizers über verschiedene Sprachen hinweg.
Ein Token kann als die grundlegende Einheit der Verarbeitung im Modell betrachtet werden. Du kannst dir das so vorstellen: Wenn du bei ChatGPT einen Text eingibst, wird dieser Text zuerst in Tokens zerlegt, bevor er verarbeitet wird.
Eine Komprimierung kann daher zu schnelleren Antwortzeiten führen. OpenAI gibt das auf ihrer Seite für die deutsche Sprache mit 1,2 mal weniger Tokens an. Rein rechnerisch bedeutet das eine Erhöhung der Geschwindigkeit um 20%.
Die Voicefunktion gibt es ja bereits. Doch jetzt wurde das Ganze wesentlich verbessert. Du hast jetzt die Möglichkeit, die Antwort von ChatGPT zu unterbrechen. Auch die Emotionen in den Stimmen sollen wesentlich verbessert worden sein. ChatGPT soll dabei Hintergrundgeräusche erkennen oder auch deine Stimmlage und Emotion.
Also ganz so, wie du dich mit einem Menschen unterhältst. Bei dem Event wurden Beispiele gezeigt, die mich wirklich beindruckt haben. Allerdings habe ich das bisher noch nicht selbst erlebt. Diese Funktion wird es wohl erst in Kürze geben.
Auf der Seite von OpenAI gibt es ein paar Videos zum Anschauen. Sam Altman hat sich dazu geäußert, dass diese Funktion noch nicht verfügbar ist:

Übersetzt heisst das: Zur Klarstellung: Der neue Sprachmodus ist noch nicht veröffentlicht (obwohl der Textmodus von GPT-4o schon verfügbar ist). Was Sie derzeit in der App nutzen können, ist die alte Version. Die neue ist das Warten wirklich wert!
Aktueller Hinweis (Quelle: X-Post von OpenAI, 26.06.24):
Ursprünglich war geplant, Ende Juni mit einer Alpha-Version für eine ausgewählte Gruppe zu beginnen. Dies verzögert sich nun. Ziel ist es, im Herbst 2024 allen Plus-Nutzern den Zugang zu ermöglichen. Der genaue Zeitplan kann jedoch nicht verbindlich zugesagt werden. Darüber hinaus wird an der Einführung neuer Video- und Screensharing-Funktionen gearbeitet.
Während du mit ChatGPT sprichst, kannst du gleichzeitig mit der Kamera deine Umgebung oder verschiedene Motive „einfangen“. ChatGPT erkennt das und kann das in die Konversation mit einbauen. Gezeigt wurde beispielsweise, dass ChatGPT gefragt wurde, um welchen Gegenstand es sich handelt. Der Einsatz von Kamera und Gespräch bietet viele Einsatzmöglichkeiten. Ich werde demnächst darüber berichten.
Auch wenn die zusätzlichen Funktionen in meiner kostenlosen Version noch nicht verfügbar waren, hoffe ich, dass sie bald kommen werden und nicht schon wieder Europa monatelang darauf warten muss.
Auf der Seite von OpenAI sind folgende Funktionen kostenlos nutzbar:
Limitierte Nutzung von GPT-4o
Limitierte Nutzung der Datenanalyse, Datei-Uploads, ChatGPT-Vision, Webzugriff und die Custom-GPTs
Wir werden sehen, ob sich dann noch ein Abo-Modell lohnt.
In Kürze soll es eine Desktop-App für den Mac geben. Dann kann mit einem Tastendruck ChatGPT aufgerufen werden und Dinge, die auf deinem Bildschirm zu sehen sind in die Konversation eingebaut werden.
Hinweis: Für Windows gibt es das noch nicht und es wird etwas dauern. Grund dafür könnte Microsoft sein, die ja mit dem Copilot ein eigenes Angebot haben und wie du vielleicht weißt an OpenAI beteiligt sind.
Die Präsentationen und Demos von ChatGPT auf dem Spring-Event waren sehr eindrucksvoll. Ob sich das so im Alltagsgebrauch auch darstellt, werden wir sehen. Ich bin sehr gespannt.
Dass die Konversation mit ChatGPT immer mehr einem Gespräch mit einem Menschen ähnelt, kann man gut oder schlecht finden. Schon jetzt schaut der größte Teil der Leute im Zug auf sein Smartphone. Demnächst wird er sich dann wohl auch mit dem Smartphone, bzw. ChatGPT unterhalten und es gibt ein ziemliches Stimmengewirr während der Bahnfahrt.
Mehr über ChatGPT erfährst du in meinem Artikel: ChatGPT verstehen: So startest du mit Fragen und Antworten.
Neu: Dein KI-Start leicht gemacht
Du interessierst dich für Künstliche Intelligenz im Alltag? In meinem Buch findest du praxisnahe Erklärungen, Beispiele und sofort umsetzbare Tipps – ganz ohne Vorwissen.
➥ Jetzt reinlesen: kostenlose Leseprobe sichern (PDF Dokument zum Download) oder
➥ direkt bei Amazon anschauen
Der neue Lernmodus von ChatGPT richtet sich an alle, die nicht nur ein Ergebnis wollen, sondern den Weg dorthin verstehen möchten.
Mehr lesenDer Gruppen-Chat von ChatGPT ermöglicht die gleichzeitige Kommunikation mit mehreren Personen und der KI. Technischen Voraussetzungen, Funktionsweise und Einsatzbereiche.
Mehr lesenSpuckt ChatGPT dir immer wieder Antworten aus, die einem Roman gleichen, oder liefert es fehlerhaften Code? Mit ein paar einfachen Kniffen erzielst du in wenigen Minuten deutlich bessere Ergebnisse.
Mehr lesenChatGPT Atlas ist ein Browser, in den die KI direkt integriert ist. In diesem Artikel erfährst du, was Atlas anders macht, wo seine Stärken liegen und für wen sich der neue KI-Browser tatsächlich lohnt.
Mehr lesenEr war stets bemüht
Antworten auf wirklich wichtige Fragen des Lebens. Beantwortet von meinem kleinen, depressiven KI-Roboter:
Ich räume die Küche auf. Ich rufe meine Frau und zeige ihr das Ergebnis. Sie stöhnt ein wenig und sagt ...
Zur Zeit gibt es noch keinen Kommentar zu diesem Thema. Das ist deine Chance 😉