Reasoning - bessere Prompts für denkende Sprachmodelle

Wie du vielleicht weißt, gibt es verschiedene Sprachmodelle. Auf der einen Seite sollen die Antworten blitzschnell und präzise sein. Aber beides zusammen, Schnelligkeit und Genauigkeit, ist mit dem heutigen Stand der Technik nicht wirklich vereinbar. Das sieht man zum Beispiel daran, dass ChatGPT unterschiedliche Sprachmodelle verwendet. Das wird sich in Zukunft sicher ändern, aber im Moment ist das so. Aber wann benutzt du welches Sprachmodell und was ist der beste Prompt, bzw. Eingabeaufforderung?

Hierzu hat OpenAI, der Anbieter von ChatGPT, einige Informationen veröffentlicht, die ich in diesem Artikel genauer „untersuchen“ möchte.

Übrigens, den Originalartikel findest du in englischer Sprache auf der ➥Website von OpenAI.

(Letzte Aktualisierung: 04.03.25)

Reasoning Modelle und GPT Modelle: Wo ist da der Unterschied?

Schauen wir uns zunächst einmal an, was es mit Reasoning-Modellen auf sich hat. Es handelt sich dabei um KI-Ansätze, die logisches Denken und Problemlösen nachbilden. Sie ermöglichen es der KI, Informationen zu analysieren, Ursache-Wirkungs-Beziehungen zu erkennen und fundierte Entscheidungen zu treffen. Es gibt zwei Haupttypen von Reasoning Modellen:

Deduktives Reasoning:
Schlussfolgerungen werden aus allgemeinen Regeln abgeleitet. Beispiel:
Regel: „Wenn es regnet, wird die Straße nass.“
Fakt: „Es regnet.“
Schlussfolgerung: „Die Straße ist nass.“

Induktives Reasoning:
Muster aus Beispielen werden erkannt und verallgemeinert. Beispiel:
Beobachtung: „Der erste Apfel, den ich probiert habe, war süß.“
Beobachtung: „Der zweite Apfel war auch süß.“
Schlussfolgerung: „Wahrscheinlich sind alle Äpfel süß.“

OpenAI schreibt dazu: Reasoning Models sind darauf trainiert, länger und intensiver über komplexe Aufgaben nachzudenken. Sie eignen sich sehr gut für die Entwicklung von Strategien, die Planung von Lösungen für komplexe Probleme und für Entscheidungen, die auf großen Mengen mehrdeutiger Informationen beruhen. Sie zeichnen sich durch hohe Genauigkeit und Präzision aus.

GPT-Modelle hingegen sind für die schnelle und kostengünstige Durchführung einfacher Aufgaben konzipiert. Die Wahl hängt von den Prioritäten der Anwendung ab: Geschwindigkeit und Kosten oder Genauigkeit und Zuverlässigkeit. GPT-Modelle sind jedoch auch in der Lage, anspruchsvolle, mehrstufige Denkprozesse zu simulieren. Soweit die Theorie.

Es gibt mittlerweile ein gutes Angebot an Reasoning-Modellen. Fast alle großen Chatbot-Anbieter haben sie im Programm. Meistens findest du neben dem Eingabefeld einen kleinen Button, auf dem meist das Wort „Deep“ steht. Zum Beispiel „Deep Research“. Es kann aber auch sein, dass du dich erst für ein entsprechendes Modell entscheiden kannst. Eingeschränkt ist die Nutzung meist kostenlos.

Wann sollte man ein Reasoning-Modell verwenden?

Reasoning-Modelle wie GPT-o3 sind besonders gut geeignet, wenn es um Genauigkeit und Zuverlässigkeit geht. Diese Modelle eignen sich vor allem für Aufgaben, die strategisches Denken, die Analyse großer Datenmengen, das Verstehen von Feinheiten und das Treffen wohlüberlegter Entscheidungen erfordern. Schauen wir uns einige Beispiele an, um dies verständlicher zu machen.

Beantwortung von Fragen, die nicht eindeutig sind:.
Beispiel: Ein Chatbot erhält eine Frage wie „Ich brauche Hilfe mit meinem Account“.

Das Reasoning Model analysiert den Zusammenhang und zieht Rückschlüsse aus der bisherigen Kommunikation, um gezielt nachzufragen: „Meinen Sie Hilfe bei der Passwortänderung oder haben Sie ein anderes Anliegen?“ So wird die eigentliche Absicht des Nutzers besser verstanden.

Dieses Beispiel habe ich auch mit GPT-4o und GPT-o3 ausprobiert. Obwohl GPT-4o auch mit einem Einzeiler geantwortet hat, war die Antwort von GPT-o3, also mit Reasoning, etwas ausführlicher:

Wenn du dir das anschaust, siehst du, wie der Chatbot seine „Gedanken“ beschreibt. Interessant!

Auswahl relevanter Informationen:
Wir werden ständig mit großen Mengen an Informationen konfrontiert. Sei es im Beruf, aber auch im privaten Umfeld. Hier kann uns die KI unterstützen.

Wenn wir uns Copilot von Microsoft anschauen, sehen wir erste Ergebnisse. Beispielsweise versucht die KI, wichtige von unwichtigen E-Mails zu trennen und dringende Nachrichten zu priorisieren.

Nur blöd, wenn sie sich irrt und die Mail deines Partners als Spam einstuft. Das führt dann unweigerlich zu „Diskussionen“.

Auswertung großer Datenmengen:
Sofern der Chatbot das Hochladen großer Datenmengen erlaubt, hast du die Möglichkeit, diese auswerten und analysieren zu lassen. Das funktioniert meiner Erfahrung nach sehr gut. Auch schon bei GPT-4o.

Auswertung der Antworten der Chatbots:
Bei jedem Chatbot steht: „Die Antworten können Fehler enthalten“. Das bedeutet, dass die angegebenen Fakten auch falsch sein können. Eine gute Möglichkeit, sich ein wenig abzusichern, ist, die Antworten noch einmal von einem Reasoning Model überprüfen zu lassen. Du kannst dann zwar auch nicht 100% sicher sein, dass die Fakten stimmen, aber du bist ein bisschen sicherer.
Du wirst lachen, aber mein liebster Fakten-Test ist die Aufzählung der Ausflugsziele in Greetsiel. Die Fakten sind bei fast allen Chatbots falsch. Diese Antworten habe ich nun mit GPT-o3 analysieren lassen und das Ergebnis kann sich wirklich sehen lassen.

Screenshot - ChatGPT o3 Reasoning Beispiel

Die falschen Informationen wurden herausgefiltert und entsprechend erklärt. Eine Falschinformation wurde aber nicht erkannt. Die Fakten müssen also immer noch selbst überprüft werden.

Weitere geeignete Anwendungsgebiete von Reasoning-Modellen sind die Auswertung von Grafiken und Diagrammen sowie die Überprüfung und Verbesserung von Programmcode.

Wie sollten die Prompts bei Reasoning-Modellen aussehen?

Vielleicht erinnerst du dich. Als ChatGPT herauskam, entwickelte sich schnell eine sogenannte „Wissenschaft“ rund um das Prompting, also die Eingabeaufforderung. Der Name war Prompt-Engineering.

Ziel ist es, genau die richtigen Anweisungen zu geben, damit die KI sinnvolle und nützliche Antworten liefert. Je präziser und klarer der Prompt formuliert ist, desto besser kann die KI darauf reagieren. Und wenn man sich diese Empfehlungen anschaut, stellt man fest, dass sie zum Teil sehr, sehr lang sind.

Ich gestehe, dass ich das nie so gemacht habe und mich auf meine Erfahrung verlassen habe. Mit den neuen Reasoning-Modellen ist das nun anders. OpenAI hat uns hier ein paar Tipps gegeben, wie der optimale Prompt für diese Modelle aussehen sollte.

Die Anweisungen sollten klar und präsize sein. Auf die Formulierung „Denke Schritt für Schritt“ sollte man verzichten, denn das tut das Modell von Haus aus. Stattdessen ist es hilfreich strukturierende Elemente wie Markdown oder XML-Tags zu verwenden, um verschiedene Bereiche des Prompts deutlich zu trennen.

Wenn du nicht weißt, was das für Trennzeichen sind, macht es nichts. Verwende stattdessen Absätze, Anführungszeichen, Trennzeichen und Doppelpunkte. Das funktioniert auch gut.

Der Unterschied zwischen dem GPT und dem Reasoning-Modell wird von OpenAI sehr treffend beschrieben: Das Reasoning-Modell verhält sich wie ein erfahrener Ratgeber - es versteht das übergeordnete Ziel und kann selbstständig die notwendigen Schritte entwickeln. Das GPT-Modell verhält sich dagegen wie ein „Anfänger“ - es erzielt die besten Ergebnisse, wenn klare und detaillierte Anweisungen gegeben werden.

Fazit und Zusammenfassung

Wenn du ein Reasoning-Modell verwendest, solltest du dich wie beschrieben etwas umstellen. Überlasse das „Denken“ dem Chatbot und stelle deine Fragen präzise und kurz. Es ist nicht nötig, Beispiele zu nennen.

Plane etwas mehr Zeit ein, denn der Chatbot antwortet nicht wie gewohnt in Sekundenschnelle, sondern braucht ein wenig, bis du das Ergebnis bekommst. Dafür ist die Antwort in der Regel besser und fehlerfreier.

Allerdings ist das Reasoning-Modell nicht für alle Zwecke geeignet, sondern auf die sogenannten MINT-Fächer ausgerichtet: Mathematik, Informatik, Naturwissenschaften und Technik. Aber wie du gesehen hast, kannst du es auch allgemein für Faktenchecks verwenden. Mein Rat an dieser Stelle ist: Probier es einfach mal aus!

Hier ist eine Liste der wichtigsten Chatbots, die Reasoning anbieten:

ChatGPT: Wähle das Modell GPT-o3 oder GPT-o1. Mehr zu diesem Modell in meinem Artikel: GPT-o3: Einsatzmöglichkeiten für die neue KI. In der kostenlosen Version gibt es den Button „Starte Reasoning für“.

Perplexity: Auswahl von „Deep Research“ bei der Eingabeaufforderung. In der kostenlosen Version habe ich das noch nicht gefunden.

Google Gemini: Kann benutzt werden, wenn man „Gemini Flash Thinking“ auswählt. Du kannst es auch in der kostenlosen Version auswählen. Mehr zu Google Gemini findest du in meinem Artikel: Google Gemini: Die ChatGPT Alternative?

Dies ist nur eine Auswahl. In kurzer Zeit werden alle führenden Chatbots diese Funktionen anbieten.

Dir hat der Artikel gefallen und du möchtest mehr über KI erfahren?

Interessante Artikel zum Thema: Chatbots

Pi: Der etwas andere Chatbot
Mit dem Chatbot Pi kannst du persönliche Unterhaltungen führen. Eine Übersicht über die Funktionen mit ...

Weiter lesen ..

ChatGPT verstehen: So startest du mit Fragen und Antworten
Chat-GPT verstehen und starten. Einführung, was du mit Chat-GPT machen kannst. Dazu einige Tipps für hilfreiche ...

Weiter lesen ..

Chatbots und die KI
Ist das die Zukunft der Kommunikation? Was kann die künstliche Intelligenz im Chat. Ideen und Gedanken am Beispiel ...

Weiter lesen ..