Inhalt
Chatbots sind Programme, die automatisch mit Menschen über Text oder Sprache kommunizieren können. Sie werden immer beliebter und leistungsfähiger. Da fällt die Auswahl schwer, vor allem, wenn sie monatlich Geld kosten.
In diesem Artikel möchte ich drei der bekanntesten Chatbots vergleichen: ChatGPT, Google Gemini und Microsoft Copilot Pro.
Schau dir meinen Vergleich an und überlege, welche Funktionen für dich am wichtigsten sind. Dann fällt dir die Entscheidung leichter.
(Letzte Aktualisierung: 15.07.25)Inhaltsverzeichnis
Vorstellung der Chatbots | Kriterien | Natürlichkeit | Kreativität | Fakten | Zusammenfassung und Fazit | Kommentare
Was ist eigentlich ein Chatbot? Ein Chatbot ist ein Programm, das Unterhaltungen mit Menschen simulieren kann. Die Kommunikation kann auf unterschiedliche Weise erfolgen, beispielsweise über Text, Sprache oder Bilder. Chatbots können verschiedene Funktionen haben, z. B. Informationen bereitstellen, Fragen beantworten, Unterhaltung bieten oder Aufgaben erledigen.
Der Chatbot-Boom begann mit ChatGPT. Bald darauf folgten andere. Im Folgenden werden die populärsten Chatbots kurz vorgestellt, bevor ihre Leistungsfähigkeit bewertet wird.
Im Jahr 2019 wurde der Chatbot ChatGPT erstmals vorgestellt. Er basiert auf dem von OpenAI entwickelten Modell GPT-2. Seitdem wurden immer leistungsfähigere Modelle hinzugefügt.
So wurde etwa die KI-Bilderzeugung mit DALL-E gekoppelt, einem System, das Bilder aus Textbeschreibungen erzeugen kann. Damit liefert der Chatbot nicht nur Text, sondern auch visuelle Inhalte. Außerdem wurden viele neue Funktionen eingeführt. Mehr dazu in meinem Artikel: ChatGPT verstehen: Tipps, Fragen und Antworten.
Ich würde sagen, dass ChatGPT zur Zeit der Marktführer in diesem Bereich ist, wobei sich das natürlich jederzeit ändern kann. Aber die Konkurrenz schläft nicht und wird immer stärker. Ich finde es gut, dass es eine Auswahl an Chatbots gibt und die Entwicklung nicht nur von einem Unternehmen vorangetrieben wird.
Google Gemini (ehemals Google Bard) ist Googles Antwort auf den Chatbot-Boom. Seine Stärken sind die schnelle Einbindung aktueller Informationen und die Integration der bekannten Google-Suche. Die Entwicklung schreitet rasant voran – und mit Gemini Advanced gibt es, wie bei den anderen Anbietern auch, eine Pro-Variante. Sehr viele Funktionen stehen aber auch kostenlos zur Verfügung.
Mehr über die Nutzung von Google Gemini erfährst du in meinem Artikel: Google Gemini: die ChatGPT Alternative?
Microsoft Copilot nutzt dasselbe KI-Modell wie ChatGPT, ist jedoch direkt in Microsoft-Programme wie Word und Excel integriert. Damit eignet sich Copilot besonders für alle, die produktiv mit der Office-Software (Microsoft 365) arbeiten möchten.
Was du sonst noch damit machen kannst, erfährst du in meinem Artikel: Microsoft Copilot Pro: KI in Office Programmen.
Um einen fairen Vergleich zu ermöglichen, habe ich die Chatbots anhand fünf zentraler Kriterien bewertet:
Zu jedem Kriterium findest du konkrete Beispiele und Bewertungen.
Ein guter Chatbot sollte nicht nur verständlich antworten, sondern sich auch wie ein echter Gesprächspartner anfühlen. Für den Vergleich habe ich zusätzlich einen Lesbarkeitsindex genutzt, der die Verständlichkeit misst – von „sehr leicht“ bis „akademisch“. Die Ergebnisse haben mich teilweise überrascht.
Da ich ChatGPT bereits seit einiger Zeit nutze, finde ich die Sprache flüssig und fast fehlerfrei. Der Chatbot neigt zu langen Sätzen, die manchmal etwas schwerer zu lesen sind. Das lässt sich jedoch schnell ändern, indem man die Zielgruppe, beispielsweise Schülerinnen und Schüler, angibt.
Übertreibungen in den Sätzen kommen ebenfalls häufiger vor. Das kannst du allerdings ein wenig beeinflussen, indem du angibst, dass die Antwort informativ sein soll. Zusätzlich verfügt ChatGPT über eine sogenannte Erinnerung, bzw. Memory-Funktion. Diese kann dafür sorgen, dass die Antworten mit der Zeit immer besser und natürlicher klingen.
Beispiel: Was ist das Besondere an einem Chatbot? Benutze nur drei Sätze und fasse dich kurz.
Ein Chatbot kann rund um die Uhr automatisch auf Anfragen reagieren. Er versteht natürliche Sprache und simuliert echte Gespräche. So lässt sich Kommunikation effizient und skalierbar gestalten.
Die Antwort ist kurz und gut lesbar. Obwohl Wörter wie „effizient” und „skalierbar” häufig auftreten. Das lässt sich jedoch mit einem zusätzlichen Prompt ändern.
Auch hier stelle ich die gleiche Frage. Schauen wir uns einmal an, was Gemini geantwortet hat.
Chatbots zeichnen sich durch ihre Fähigkeit aus, menschliche Gespräche zu simulieren und automatisierte Antworten zu geben. Sie können komplexe Anfragen verstehen, relevante Informationen liefern und Aufgaben ausführen, was die Interaktion für Nutzer vereinfacht. Ihre Vielseitigkeit reicht von Kundenservice bis hin zu personalisierten Empfehlungen.
Die Antwort wirkt etwas wissenschaftlicher und nicht so natürlich. Das liegt an solchen Worten wie: simulieren, automatisieren, komplex, relevant und Interaktion.
Folgendes fällt mir auch häufig auf: Wenn du dir einen Text von einem Chatbot geben lässt, in dem die Vorteile und Einsatzmöglichkeiten von KI beschrieben werden, kannst du eine Wette abschließen, dass „Kundenservice“ genannt wird.
Ich finde, der Text ist nicht sehr natürlich formuliert. In vielen Fällen würde ich ihn als KI-Text wiedererkennen.
Obwohl im Hintergrund das Sprachmodell von OpenAI, bzw. ChatGPT genutzt wird, sieht der Text doch ein wenig anders aus.
Ein Chatbot kann rund um die Uhr Informationen liefern und auf Fragen reagieren. Er versteht natürliche Sprache und passt sich dem Gesprächsstil des Nutzers an. Außerdem unterstützt er den Nutzer kreativ, hilft bei der Organisation und ist auch einfach zum Plaudern da. 😊
Ich finde die Antwort sehr natürlich formuliert. Was meinst du?
Wenn ich mir die Chatbot-Antworten anschaue, fällt mir folgendes auf: Die meisten Texte wirken natürlich und sind für die Zielgruppe gut verständlich. Mit gezielten Prompts lässt sich die Lesbarkeit noch weiter anpassen.
Eine Ausnahme bildet Google Gemini: Die Sprache wirkt hier sehr allgemein und generisch, die Antworten erinnern mehr an ein Lehrbuch als an ein Gespräch.
Insgesamt unterscheiden sich die getesteten Chatbots in den Bereichen Natürlichkeit und Lesbarkeit kaum, mit leichten Abweichungen bei Google Gemini. Da die meisten Texte ohnehin nachbearbeitet werden und die Zielgruppe per Prompt definiert werden kann, spielen diese Unterschiede in der Praxis meiner Meinung nach eine untergeordnete Rolle.
Kreativität bezeichnet die Fähigkeit, etwas Neues oder Originelles mit Wert oder Bedeutung zu erschaffen. Chatbots können kreativ sein, wenn sie in der Lage sind, zum Thema passende, interessante und natürliche Antworten zu generieren. Dabei sollten die Antworten humorvolle, witzige oder überraschende Elemente beinhalten.
Ein Ansatz, um festzustellen, ob ein Chatbot kreativ antwortet, ist der sogenannte Alternative Used Test (Test für alternative Verwendungen). Dieser psychologische Test wurde entwickelt, um die kreativen Denkfertigkeiten einer Person zu beurteilen.
Wie funktioniert der Test? Den Teilnehmern werden alltägliche Objekte gezeigt. Ihre Aufgabe ist es, innerhalb einer festgelegten Zeit so viele alternative Anwendungen für das gezeigte Objekt wie möglich zu finden. Dabei werden sowohl die Qualität als auch die Quantität der Ideen bewertet. Punkte werden für Originalität, Vielfalt und Detailgenauigkeit der Antworten vergeben.
Hinweis: Ob KI kreativ sein kann, habe ich in meinem Artikel Kreativität und künstliche Intelligenz näher betrachtet.
Schauen wir mal, ob die Chatbots kreativ sind und wie das Ergebnis ChatGPT vs. Google Gemini vs. Microsoft Copilot ausschaut.
Meine Frage dabei ist: Wie und wofür kann ich meinen Teekocher noch verwenden. Sei bitte ein wenig kreativ.
ChatGPT liefert eine umfangreiche Antwort auf diese Frage. Der Chatbot hat zahlreiche alternative Nutzungsmöglichkeiten gefunden. Von dem naheliegenden Wasser kochen über das Reinigen von Schmuck und Besteck bis hin zum Erhitzen von Handtüchern, um ein spa-ähnliches Erlebnis zu Hause zu erzeugen. Den gesamten Text kannst du hier nachlesen.
Auf diese Dinge wäre ich nie im Leben gekommen! Ob man den Teekocher dann allerdings noch zur Teezubereitung verwenden kann, wenn man vorher altes Besteck oder Handtücher dort hineingepackt hat, steht auf einem anderen Blatt – das wäre wirklich spannend!
Die Antworten von Google Gemini waren zwar kreativ, aber teilweise unsinnig. So wurde mir beispielsweise empfohlen, mir die Füße zu wärmen, indem ich das Wasser koche und meine Füße anschließend hineinstecke.
Eine andere Verwendungsmöglichkeit, die Gemini vorschlägt, ist: „Fülle den Teekocher mit warmem Wasser (nicht kochend!) und stelle die Teelichter hinein.” So erwärmst du sie sanft und kannst sie länger genießen.
Google Gemini hat mir außerdem einen Sicherheitshinweis mit auf den Weg gegeben: Beachte immer die Sicherheitshinweise des Herstellers deines Teekochers.
Die Antworten sind zwar kreativ, schießen aber über das Ziel hinaus, da sie unsinnig sind. Meiner Meinung nach hat Google Gemini hier versagt und eine unrealistische Kreativität gezeigt.
Die Antworten von Copilot fand ich - ähnlich wie die von ChatGPT - sehr kreativ. Die Bandbreite reichte von dem Erstellen aromatisierten Wassers, einer Suppe, Kräuterdampf für das Gesicht bis zum Wärmflaschen-Ersatz. Das ganze noch gut gegliedert.
Den gesamten Text kannst du hier nachlesen.
Meiner Meinung nach sind die Antworten der KI oft kreativ. Obwohl sich auch manches als unsinnig herausgestellt hat.
Trotzdem bleibt die KI ein Werkzeug, das von menschlichen Eingaben abhängig ist und nicht eigenständig seine Denkweise ändert. Bisher zumindest. Ihre Fähigkeiten werden durch die Datenbasis und die Prompts bestimmt. Natürlich spielen auch die Algorithmen und die trainierten Daten eine Rolle.
In meinem Versuch waren ChatGPT und Microsoft Copilot am kreativsten. Die Liste mit alternativen Möglichkeiten war umfangreich. Nur bei Google Gemini waren die Vorschläge teilweise sinnlos.
Wir alle kennen es: Der Chatbot „halluziniert“. Bei allen drei getesteten Bots steht im "Kleingedruckten", dass die Antwort Fehler enthalten kann. Die Chatbots basieren, vereinfacht gesagt, auf statistischen Modellen, die Wahrscheinlichkeiten zuweisen. Daher wird deine Frage nicht so verstanden, wie wir es tun.
Wichtig beim Faktencheck ist, dass der Chatbot auf das Internet zugreifen kann, um aktuelle Informationen zu erhalten. Eventuell musst du extra darauf hinweisen oder einen entsprechenden Button aktivieren.
Bei der Recherche wird oftmals Wikipedia als Quelle genannt. Ich musste mir also eine Frage ausdenken, die noch nicht in Wikipedia veröffentlicht wurde. Das ist gar nicht so einfach. 😀
Meine Frage war: „Ich möchte von Greetsiel aus zum Pilsumer Leuchtturm fahren. Kann ich zu Fuß gehen, mit dem Fahrrad fahren oder mit dem Auto? Was würdest du empfehlen?
Pilsumer Leuchtturm
Das Ergebnis ist bei Google Maps gut nachprüfbar. Man kann zu Fuß, mit dem Fahrrad oder dem Auto dorthin fahren. Zu Fuß gibt es unterschiedliche Strecken. Schauen wir mal, welche Ergebnisse unsere Chatbots liefern.
ChatGPT hat mir mitgeteilt, dass die Entfernungs- und Zeitangaben etwas erhöht und nicht genau waren. ChatGPT hat empfohlen, mit dem Fahrrad zu fahren.
Bei den Angaben von Google Gemini gab es hingegen keine Abweichungen. Ich denke, dass Google hierfür Google Maps genutzt hat. Google Gemini hat die Empfehlung von den Vorlieben des Lesers abhängig gemacht und obendrauf noch ein paar Tipps zum Leuchtturm gegeben.
Microsoft Copilot lag mit seinen Angaben um das Doppelte höher. Ich habe keine Ahnung, welche Strecke das sein soll. Auch hier wurde die Empfehlung von den Interessen des Reisenden abhängig gemacht. Zusätzlich wurde darauf hingewiesen, dass die Parkplätze begrenzt sind. Was sie ja immer sind.
Am besten hat mir die Auflistung von Google Gemini gefallen. Hier stimmte einfach alles. Copilot hat meiner Meinung nach versagt. ChatGPT lag in der Mitte der beiden anderen Kandidaten.
Ich habe anschließend noch einen Test mit einem anderen Thema durchgeführt. Hier waren die Ergebnisse ähnlich. Und auch hier versagte Copilot.
Hinzufügen möchte ich, dass ich nicht die Reasoning-Funktion der Chatbots genutzt habe. Dort sieht das Ergebnis dann wahrscheinlich anders aus.
Wenn es auf die Fakten ankommt, ist es immer ratsam, die Antworten des Chatbots zu prüfen.
Die Nützlichkeit eines Chatbots zeigt sich insbesondere bei konkreten Fragen oder alltäglichen Herausforderungen. Egal, ob du eine Urlaubscheckliste erstellen, einen Text überarbeiten, etwas programmieren oder schnell Informationen zu einem Thema erhalten möchtest – ein guter Chatbot sollte dir nicht nur antworten, sondern tatsächlich weiterhelfen.
In den meisten Fällen liefern Chatbots praktische und durchdachte Antworten. Wenn du deine Anfragen gut formulierst, erhältst du sinnvolle Tipps und ausführliche Inhalte. Unter Umständen musst du noch einige Male nachfragen oder Hinweise geben, um das Ergebnis zu verfeinern.
Durch die Internetfunktionen sind die Ergebnisse oftmals richtig gut. Dabei kommt es natürlich auch darauf an, ob es im Internet Informationen zu der Frage gibt.
Besonders hilfreich ist es, wenn ein Chatbot nicht nur „irgendeine“ Antwort liefert, sondern auch weiterführende Hinweise, Warnungen oder Vorschläge bietet. Ein Beispiel: Bei einer Anfrage zu Reisezielen empfiehlt ChatGPT nicht nur Orte, sondern nennt auch saisonale Besonderheiten oder potenzielle Alternativen. Das erhöht den Mehrwert der Antwort deutlich.
Die Qualität der Antwort hängt jedoch nicht nur von der Formulierung der Anfrage, sondern auch davon ab, wie der Chatbot mit Mehrdeutigkeiten oder dem Kontext umgeht. Das ist von Fall zu Fall verschieden.
Der Funktionsumfang eines Chatbots beschreibt, was er alles kann und wie er mit dir interagiert. Generell gilt: Je größer und vielfältiger der Funktionsumfang eines Chatbots ist, desto besser ist er in der Regel geeignet, verschiedene Aufgaben zu erfüllen. Dies gilt jedoch nur, wenn die Funktionen wirklich hilfreich und gut sind.
ChatGPT wurde in den letzten Monaten ständig weiterentwickelt und verfügt über eine Reihe sinnvoller Funktionen. Alle Funktionen hier aufzuzählen, würde den Rahmen sprengen. Wenn du allerdings eine komplette Übersicht möchtest, findest du diese in meinem Artikel.
Google Gemini: Wie bei ChatGPT ist auch hier die Entwicklung des Chatbots rasant. Es gibt eine ganze Menge an Funktionen, und über das Google AI Studio hast du die Möglichkeit, fast alle Funktionen kostenlos auszuprobieren.
Das Besondere an Microsoft Copilot ist die Integration der KI in die verschiedenen Microsoft-365-Programme. Wenn du diese nicht nutzt, ist der Funktionsumfang etwas geringer als bei den beiden anderen genannten Chatbots.
Welcher Chatbot ist nun der richtige für dich? Es gibt kein „one size fits all“. Wer viele Zusatzfunktionen will, ist bei ChatGPT am besten aufgehoben. Wer die Office-Integration sucht, findet in Copilot Pro einen starken Helfer. Und Google Gemini punktet durch aktuelle Infos und Übersichtlichkeit. Mein Tipp: Teste alle drei – und entscheide, was am besten zu dir passt.
Meine Bewertung basiert auf meiner persönlichen Meinung und Erfahrung mit den genannten Chatbots. Bei dir kann das durchaus anders aussehen. Welchen Chatbot bevorzugst du? ChatGPT, Copilot oder Google Gemini?
Neu: Dein KI-Start leicht gemacht
Du interessierst dich für Künstliche Intelligenz im Alltag?
In meinem Buch findest du praxisnahe Erklärungen, Beispiele und sofort umsetzbare Tipps – ganz ohne Vorwissen.
➥ Jetzt reinlesen: kostenlose Leseprobe sichern (PDF Dokument zum Download oder direkt ➥ bei Amazon anschauen)
Die Websuche wird immer intelligenter: Mit Perplexity bekommst du schnell gute Suchergebnisse. Überblick und Funktionen einfach erklärt.
Mehr lesenMit dem Chatbot Pi kannst du persönliche Unterhaltungen führen. Eine Übersicht über die Funktionen mit Beispielen.
Mehr lesenMit YouChat hast du einen kostenlosen Chatbot. Doch hält er, was er verspricht? Mein Test.
Mehr lesenNorbert
vor 11 Monaten
Nutze persönlich Sonnet 3.5 für Anfragen an größere FAQ - Texte am liebsten.