Reasoning - bessere Prompts für denkende Sprachmodelle

Wie du vielleicht weißt, gibt es verschiedene Sprachmodelle. Auf der einen Seite sollen die Antworten blitzschnell und präzise sein. Aber beides zusammen, Schnelligkeit und Genauigkeit, ist mit dem heutigen Stand der Technik nicht wirklich vereinbar. Das sieht man zum Beispiel daran, dass ChatGPT unterschiedliche Sprachmodelle verwendet. Das wird sich in Zukunft sicher ändern, aber im Moment ist das so. Aber wann benutzt du welches Sprachmodell und was ist der beste Prompt, bzw. Eingabeaufforderung?

Hierzu hat OpenAI, der Anbieter von ChatGPT, einige Informationen veröffentlicht, die ich in diesem Artikel genauer „untersuchen“ möchte.

Übrigens, den Originalartikel findest du in englischer Sprache auf der ➥Website von OpenAI.

(Letzte Aktualisierung: 04.03.25)
Foto
Buch: DU und die KI

Reasoning Modelle und GPT Modelle: Wo ist da der Unterschied?


Schauen wir uns zunächst einmal an, was es mit Reasoning-Modellen auf sich hat. Es handelt sich dabei um KI-Ansätze, die logisches Denken und Problemlösen nachbilden. Sie ermöglichen es der KI, Informationen zu analysieren, Ursache-Wirkungs-Beziehungen zu erkennen und fundierte Entscheidungen zu treffen. Es gibt zwei Haupttypen von Reasoning Modellen:

Deduktives Reasoning:
Schlussfolgerungen werden aus allgemeinen Regeln abgeleitet. Beispiel:
Regel: „Wenn es regnet, wird die Straße nass.“
Fakt: „Es regnet.“
Schlussfolgerung: „Die Straße ist nass.“

Induktives Reasoning:
Muster aus Beispielen werden erkannt und verallgemeinert. Beispiel:
Beobachtung: „Der erste Apfel, den ich probiert habe, war süß.“
Beobachtung: „Der zweite Apfel war auch süß.“
Schlussfolgerung: „Wahrscheinlich sind alle Äpfel süß.“

OpenAI schreibt dazu: Reasoning Models sind darauf trainiert, länger und intensiver über komplexe Aufgaben nachzudenken. Sie eignen sich sehr gut für die Entwicklung von Strategien, die Planung von Lösungen für komplexe Probleme und für Entscheidungen, die auf großen Mengen mehrdeutiger Informationen beruhen. Sie zeichnen sich durch hohe Genauigkeit und Präzision aus.

GPT-Modelle hingegen sind für die schnelle und kostengünstige Durchführung einfacher Aufgaben konzipiert. Die Wahl hängt von den Prioritäten der Anwendung ab: Geschwindigkeit und Kosten oder Genauigkeit und Zuverlässigkeit. GPT-Modelle sind jedoch auch in der Lage, anspruchsvolle, mehrstufige Denkprozesse zu simulieren. Soweit die Theorie.

Es gibt mittlerweile ein gutes Angebot an Reasoning-Modellen. Fast alle großen Chatbot-Anbieter haben sie im Programm. Meistens findest du neben dem Eingabefeld einen kleinen Button, auf dem meist das Wort „Deep“ steht. Zum Beispiel „Deep Research“. Es kann aber auch sein, dass du dich erst für ein entsprechendes Modell entscheiden kannst. Eingeschränkt ist die Nutzung meist kostenlos.


Wann sollte man ein Reasoning-Modell verwenden?


Reasoning-Modelle wie GPT-o3 sind besonders gut geeignet, wenn es um Genauigkeit und Zuverlässigkeit geht. Diese Modelle eignen sich vor allem für Aufgaben, die strategisches Denken, die Analyse großer Datenmengen, das Verstehen von Feinheiten und das Treffen wohlüberlegter Entscheidungen erfordern. Schauen wir uns einige Beispiele an, um dies verständlicher zu machen.

Beantwortung von Fragen, die nicht eindeutig sind:.
Beispiel: Ein Chatbot erhält eine Frage wie „Ich brauche Hilfe mit meinem Account“.

Das Reasoning Model analysiert den Zusammenhang und zieht Rückschlüsse aus der bisherigen Kommunikation, um gezielt nachzufragen: „Meinen Sie Hilfe bei der Passwortänderung oder haben Sie ein anderes Anliegen?“ So wird die eigentliche Absicht des Nutzers besser verstanden.

Dieses Beispiel habe ich auch mit GPT-4o und GPT-o3 ausprobiert. Obwohl GPT-4o auch mit einem Einzeiler geantwortet hat, war die Antwort von GPT-o3, also mit Reasoning, etwas ausführlicher:

Screenshot - Antwort GPT-o3

Wenn du dir das anschaust, siehst du, wie der Chatbot seine „Gedanken“ beschreibt. Interessant!

Auswahl relevanter Informationen:
Wir werden ständig mit großen Mengen an Informationen konfrontiert. Sei es im Beruf, aber auch im privaten Umfeld. Hier kann uns die KI unterstützen.

Wenn wir uns Copilot von Microsoft anschauen, sehen wir erste Ergebnisse. Beispielsweise versucht die KI, wichtige von unwichtigen E-Mails zu trennen und dringende Nachrichten zu priorisieren.

Comic KI-Bild: Streit

Nur blöd, wenn sie sich irrt und die Mail deines Partners als Spam einstuft. Das führt dann unweigerlich zu „Diskussionen“.

Auswertung großer Datenmengen:
Sofern der Chatbot das Hochladen großer Datenmengen erlaubt, hast du die Möglichkeit, diese auswerten und analysieren zu lassen. Das funktioniert meiner Erfahrung nach sehr gut. Auch schon bei GPT-4o.

Auswertung der Antworten der Chatbots:
Bei jedem Chatbot steht: „Die Antworten können Fehler enthalten“. Das bedeutet, dass die angegebenen Fakten auch falsch sein können. Eine gute Möglichkeit, sich ein wenig abzusichern, ist, die Antworten noch einmal von einem Reasoning Model überprüfen zu lassen. Du kannst dann zwar auch nicht 100% sicher sein, dass die Fakten stimmen, aber du bist ein bisschen sicherer.
Du wirst lachen, aber mein liebster Fakten-Test ist die Aufzählung der Ausflugsziele in Greetsiel. Die Fakten sind bei fast allen Chatbots falsch. Diese Antworten habe ich nun mit GPT-o3 analysieren lassen und das Ergebnis kann sich wirklich sehen lassen.

Screenshot - ChatGPT o3 Reasoning Beispiel

Die falschen Informationen wurden herausgefiltert und entsprechend erklärt. Eine Falschinformation wurde aber nicht erkannt. Die Fakten müssen also immer noch selbst überprüft werden.

Weitere geeignete Anwendungsgebiete von Reasoning-Modellen sind die Auswertung von Grafiken und Diagrammen sowie die Überprüfung und Verbesserung von Programmcode.


Wie sollten die Prompts bei Reasoning-Modellen aussehen?


Vielleicht erinnerst du dich. Als ChatGPT herauskam, entwickelte sich schnell eine sogenannte „Wissenschaft“ rund um das Prompting, also die Eingabeaufforderung. Der Name war Prompt-Engineering.

Ziel ist es, genau die richtigen Anweisungen zu geben, damit die KI sinnvolle und nützliche Antworten liefert. Je präziser und klarer der Prompt formuliert ist, desto besser kann die KI darauf reagieren. Und wenn man sich diese Empfehlungen anschaut, stellt man fest, dass sie zum Teil sehr, sehr lang sind.

Ich gestehe, dass ich das nie so gemacht habe und mich auf meine Erfahrung verlassen habe. Mit den neuen Reasoning-Modellen ist das nun anders. OpenAI hat uns hier ein paar Tipps gegeben, wie der optimale Prompt für diese Modelle aussehen sollte.

Die Anweisungen sollten klar und präsize sein. Auf die Formulierung „Denke Schritt für Schritt“ sollte man verzichten, denn das tut das Modell von Haus aus. Stattdessen ist es hilfreich strukturierende Elemente wie Markdown oder XML-Tags zu verwenden, um verschiedene Bereiche des Prompts deutlich zu trennen.

Wenn du nicht weißt, was das für Trennzeichen sind, macht es nichts. Verwende stattdessen Absätze, Anführungszeichen, Trennzeichen und Doppelpunkte. Das funktioniert auch gut.

Der Unterschied zwischen dem GPT und dem Reasoning-Modell wird von OpenAI sehr treffend beschrieben: Das Reasoning-Modell verhält sich wie ein erfahrener Ratgeber - es versteht das übergeordnete Ziel und kann selbstständig die notwendigen Schritte entwickeln. Das GPT-Modell verhält sich dagegen wie ein „Anfänger“ - es erzielt die besten Ergebnisse, wenn klare und detaillierte Anweisungen gegeben werden.


Fazit und Zusammenfassung


Wenn du ein Reasoning-Modell verwendest, solltest du dich wie beschrieben etwas umstellen. Überlasse das „Denken“ dem Chatbot und stelle deine Fragen präzise und kurz. Es ist nicht nötig, Beispiele zu nennen.

Plane etwas mehr Zeit ein, denn der Chatbot antwortet nicht wie gewohnt in Sekundenschnelle, sondern braucht ein wenig, bis du das Ergebnis bekommst. Dafür ist die Antwort in der Regel besser und fehlerfreier.

Allerdings ist das Reasoning-Modell nicht für alle Zwecke geeignet, sondern auf die sogenannten MINT-Fächer ausgerichtet: Mathematik, Informatik, Naturwissenschaften und Technik. Aber wie du gesehen hast, kannst du es auch allgemein für Faktenchecks verwenden. Mein Rat an dieser Stelle ist: Probier es einfach mal aus!

Hier ist eine Liste der wichtigsten Chatbots, die Reasoning anbieten:

ChatGPT: Wähle das Modell GPT-o3 oder GPT-o1. Mehr zu diesem Modell in meinem Artikel: GPT-o3: Einsatzmöglichkeiten für die neue KI. In der kostenlosen Version gibt es den Button „Starte Reasoning für“.

Perplexity: Auswahl von „Deep Research“ bei der Eingabeaufforderung. In der kostenlosen Version habe ich das noch nicht gefunden.

Google Gemini: Kann benutzt werden, wenn man „Gemini Flash Thinking“ auswählt. Du kannst es auch in der kostenlosen Version auswählen. Mehr zu Google Gemini findest du in meinem Artikel: Google Gemini: Die ChatGPT Alternative?

Dies ist nur eine Auswahl. In kurzer Zeit werden alle führenden Chatbots diese Funktionen anbieten.

▸ Und nun noch etwas zum Schmunzeln

Ständig verschwinden Socken. Wie kann das sein?

Antworten auf wirklich wichtige Fragen des Lebens. Beantwortet von meinem kleinen, depressiven KI-Roboter:

Und schon wieder halte ich eine Socke in den Händen und kann die zweite nicht finden. Wie ist das möglich?

Weiter lesen ...

Dir hat der Artikel gefallen und du möchtest mehr über KI erfahren?

Buch: DU und die KI

Interessante Artikel zum Thema: Chatbots


Kategorie - Foto

Chatbot Vergleich: ChatGPT vs. Gemini vs. Copilot
Entdecke die Stärken und Schwächen der führenden Chatbots. Die Vergleichstabelle hilft dir, den besten Chatbot für deine Bedürfnisse zu ...

Weiter lesen ..

Kategorie - Foto

YouChat: Vor- und Nachteile des KI-Chatbots im Vergleich
Mit YouChat hast du einen kostenlosen Chatbot. Doch hält er, was er verspricht? Mein ...

Weiter lesen ..

Kategorie - Foto

Chatbot Auswahl - Finde den Richtigen!
Welcher Chatbot ist für dich der Richtige. Gib an, was dir wichtig ist und erhalte eine Rangliste mit ...

Weiter lesen ..





Kommentare



Zur Zeit gibt es noch keinen Kommentar zu diesem Thema. Das ist deine Chance 😉