ChatGPT verweist doppelt so häufig auf fehlerhafte Links wie Google AI Overviews

Geschrieben von
Nico Kavelar
Marketing Manager mit umfassender SEO- und SEA-Expertise zur gezielten Markenstärkung im DACH-Raum.
Dez 22, 2025
10 Min. Lesezeit

Wir kennen die Situation alle: Man klickt auf einen von ChatGPT vorgeschlagenen Link und landet auf einer 404-Fehlerseite.

Seit dem öffentlichen Start von ChatGPT äußern sich SEO- und Entwickler-Communities kritisch zur Fähigkeit des Modells, funktionierende und tatsächlich existierende URLs zu zitieren.

Ein Nutzer testete 2023 mehrere in einer ChatGPT-Antwort verlinkte URLs großer Publisher wie BBC, CNN, Reuters und The Guardian. Das Ergebnis war ernüchternd: Keiner der Links führte zu einer existierenden Seite.

Doch wie sieht es 2025 aus? Hat sich das Problem tatsächlich verbessert oder spricht heute einfach niemand mehr darüber?

Um das zu klären, haben wir die Daten analysiert.

Zentrale Erkenntnisse
  • 404-Fehler sind das Hauptproblem bei fehlerhaften ChatGPT-Links

    1,34 % der von ChatGPT zitierten URLs weisen Client-seitige Fehler (4xx) auf. In 91 % dieser Fälle handelt es sich um einen 404-Fehler („Not Found“).

  • ChatGPT leitet Nutzer häufiger auf nicht erreichbare Seiten weiter als jedes Google-System

    1,22 % der ChatGPT-Zitate verweisen auf 404-Seiten. Bei Google liegt der Anteil defekter Seiten deutlich niedriger: am höchsten im AI Mode (0,87 %), gefolgt von der organischen Suche (0,65 %) und AI Overviews (0,56 %).

  • Andere 4xx-Fehler kommen vor, sind aber nicht das typische „Broken-Link“-Problem

    Statuscodes wie 410 Gone (8,33 % der Client-Fehler) und 451 Unavailable for Legal Reasons (0,67 %) treten vergleichsweise selten auf. In der Regel sind sie auf bewusste Inhalteentfernungen oder rechtliche Einschränkungen zurückzuführen und nicht auf halluzinierte oder fehlerhafte URLs.

  • Google nutzt Weiterleitungen deutlich häufiger als ChatGPT

    Nur 0,79 % der von ChatGPT zitierten URLs sind Weiterleitungen. In Googles Systemen liegt dieser Anteil deutlich höher: 5,75 % in der organischen Suche, 5,45 % im AI Mode und 2,85 % in AI Overviews. Auffällig ist zudem: ChatGPT verweist überwiegend auf permanente Redirects (301/308), während Google auch temporäre Weiterleitungen (302/307) berücksichtigt.

Warum halluzinierte URLs mehr sind als nur ein Ärgernis

Halluzinierte oder schlicht nicht erreichbare Links sind keine bloße Unannehmlichkeit. Im Kontext von AI Search führen sie zu konkreten Folgeproblemen:

  • Vertrauensverlust bei Nutzern
  • Unterbrochene Research-Workflows
  • Störungen bei kommerzieller Suchintention
  • Nicht existierende URLs können dennoch Links und Traffic generieren

Im März 2025 fiel unserer Head of SEO, Anastasia Kotsiubynska, in Google Analytics ein ungewöhnliches Muster auf: ChatGPT leitete Traffic auf URLs, die auf unserer Website nicht existierten.

Dabei handelte es sich weder um veraltete Seiten noch um fehlerhafte Weiterleitungen. Die URLs waren vollständig frei erfunden.

Anastasia Kotsiubynska über halluzinierte URLs in ChatGPT

Über einen Zeitraum von drei Monaten leitete ChatGPT Traffic auf rund 70 URLs, die einen 404-Fehler zurückgaben.

  • Der Großteil dieser URLs verzeichnete 1–3 Sitzungen, einzelne kamen auf über 20 Sessions.
  • Rund 20 der nicht existierenden URLs wiesen bereits Backlinks auf – externe Websites verlinkten somit auf Seiten, die faktisch nicht existieren.

Kurz darauf weitete der SEO-Spezialist Dan Hinckley die Analyse auf einen deutlich größeren Datensatz aus. Grundlage waren über 18.000 Landingpages, die Traffic von ChatGPT erhielten. Die Ergebnisse zeigen, dass es sich nicht um Einzelfälle handelt:

  • 3,35 % der von ChatGPT vermittelten Besuche landeten auf 404-Seiten.
Dan Hinckley über halluzinierte URLs in ChatGPT

In kleinem Maßstab mag dieser Anteil überschaubar wirken. Auf globaler Ebene ist er es nicht.

Im Juli 2025 gab OpenAI gegenüber Axios an, dass ChatGPT inzwischen rund 2,5 Milliarden Anfragen pro Tag verarbeitet. Selbst wenn nur ein kleiner Teil dieser Interaktionen zitierte Links enthält und wiederum nur ein Bruchteil dieser Links fehlerhaft ist, summiert sich das auf Millionen von Broken-Link-Erlebnissen pro Tag.

Bei diesem Umfang sind solche Fälle längst kein Randproblem mehr. Sie werden zu einer spürbaren Quelle für Vertrauensverlust und verpasste Chancen – sowohl für Nutzer als auch für Unternehmen.

Auch John Mueller von Google äußerte sich zu diesem Thema. Er wies darauf hin, dass halluzinierte Links mit zunehmender Verbreitung von KI-Systemen kurzfristig sogar häufiger auftreten könnten, bevor ihr Anteil mit besserer Anbindung an reale URLs wieder sinkt.

John Mueller über halluzinierte URLs in der KI-Suche

Damit sind wir zurück bei der zentralen Frage dieser Analyse:

Hat sich die Anzahl fehlerhafter Links in der KI-Suche tatsächlich verringert?

Defekte Links (4xx) in ChatGPT-Antworten

Wenn ChatGPT Nutzer auf eine nicht erreichbare Seite verweist, handelt es sich fast immer um einen 404-Fehler („Not Found“).

Bevor wir jedoch im Detail betrachten, wo und wie Probleme auftreten, lohnt sich zunächst ein Blick darauf, wie viele funktionierende URLs ChatGPT tatsächlich ausliefert.

Für diese Analyse haben wir 145.463 von ChatGPT zitierte URLs ausgewertet. Der Großteil davon (97,55 %) lieferte einen 200-Statuscode zurück – die Seiten waren also erfolgreich erreichbar.

  • Die zweithäufigste Kategorie waren Client-seitige Fehler (4xx) mit einem Anteil von 1,34 %. Diese Statuscodes zeigen an, dass eine Seite für Nutzer nicht zugänglich ist, meist weil sie nicht existiert oder der Zugriff blockiert wird.
  • Weiterleitungen (3xx) machten 0,79 % der URLs aus. In diesen Fällen war ein zusätzlicher Schritt erforderlich, um zur finalen Zielseite zu gelangen.
  • Server-seitige Fehler (5xx) traten nur selten auf und machten lediglich 0,16 % aller untersuchten Fälle aus.
URL-Statuscodes in von ChatGPT zitierten URLs

Von den URLs mit Client-seitigen Fehlern (4xx) entfielen 91 % auf 404 Not Found. Das entspricht 1,22 % aller untersuchten URLs.

Das bedeutet: Fehlerhafte ChatGPT-Links sind in der Regel nicht auf Zugriffsbeschränkungen oder temporäre Verfügbarkeitsprobleme zurückzuführen, sondern auf URLs, die schlicht nicht existieren.

Ein genauerer Blick auf die Client-seitigen Fehler (4xx) zeigt einige zusätzliche Muster:

  • 410 „Gone“: 162 Fälle (8,33 % der 4xx-Fehler). Im Unterschied zu 404 handelt es sich hierbei um einen bewusst gesetzten Statuscode, mit dem Website-Betreiber dauerhaft entfernte Inhalte kennzeichnen.
  • 451 „Unavailable for Legal Reasons“: 13 Fälle (0,67 % der 4xx-Fehler). Dieser Statuscode tritt auf, wenn Inhalte aufgrund rechtlicher Vorgaben oder gerichtlicher Anordnungen gesperrt sind. Er ist selten, zeigt aber, dass ChatGPT vereinzelt auch auf bewusst eingeschränkte Inhalte verweist.
Client-seitige Fehler in von ChatGPT zitierten URLs

Zusammen machen diese Statuscodes weniger als 9 % aller Client-seitigen Fehler bei von ChatGPT zitierten URLs aus. Sie entsprechen jedoch nicht dem, was Nutzer typischerweise als „Broken Link“ wahrnehmen. In der Praxis handelt es sich dabei fast immer um eine 404-Seite.

404-Raten in Google-Systemen im Vergleich

Wir haben dieselbe Analyse auf Google AI Overviews, AI Mode und die klassische organische Suche (SERP) angewendet. Der folgende Vergleich zeigt, wie sich die untersuchten Systeme hinsichtlich des Anteils von 404-Fehlern unter den zitierten URLs unterscheiden:

  • ChatGPT: 1,22 %
  • AI Mode: 0,87 %
  • Organische Suche (SERP): 0,65 %
  • AI Overviews: 0,56 %
404-Fehler in von ChatGPT und Google zitierten URLs

Auf Basis unserer Analyse weisen von ChatGPT zitierte URLs mit 1,22 % die höchste 404-Rate unter allen untersuchten Systemen auf. Gleichzeitig laden über 97 % der von ChatGPT genannten URLs erfolgreich.

Das bedeutet nicht, dass das Problem gelöst ist. Es zeigt jedoch, dass sich das Ausmaß des Problems verändert hat.

Bei Googles Systemen treten 404-Fehler insgesamt seltener auf. AI Overviews weisen mit 0,56 % die niedrigste 404-Rate auf, während AI Mode mit 0,87 % den höchsten Wert innerhalb der Google-Systeme erreicht. Beide liegen jedoch unter dem Wert von ChatGPT.

Die folgende Übersicht zeigt eine detailliertere Aufschlüsselung der Client-seitigen Fehler in ChatGPT im Vergleich zur organischen Google-Suche sowie zu Googles KI-Antworten:

ChatGPT

Client-seitige Fehler gesamt

1.945 (1,34%)

404

1.770 (91%)

410

162 (8,33%)

451

13 (0,67%)

418 („I’m a teapot“)

AI Overviews

Client-seitige Fehler gesamt

2.787 (0,63%)

404

2.447 (87,8%)

410

72 (2,58%)

451

186 (6,67%)

418 („I’m a teapot“)

82 (2,94%)

AI Mode

Client-seitige Fehler gesamt

4.876 (1%)

404

4.199 (86,12%)

410

269 (5,52%)

451

243 (4,98%)

418 („I’m a teapot“)

SERP

Client-seitige Fehler gesamt

3.204 (0,76%)

404

2.729 (85,17%)

410

451

305 (9,52%)

418 („I’m a teapot“)

170 (5,31%)

System
Client-seitige Fehler gesamt
404
410
451
418 („I’m a teapot“)
ChatGPT

1.945 (1,34%)

1.770 (91%)

162 (8,33%)

13 (0,67%)

AI Overviews

2.787 (0,63%)

2.447 (87,8%)

72 (2,58%)

186 (6,67%)

82 (2,94%)

AI Mode

4.876 (1%)

4.199 (86,12%)

269 (5,52%)

243 (4,98%)

SERP

3.204 (0,76%)

2.729 (85,17%)

305 (9,52%)

170 (5,31%)

Interessante Trends:

  1. 404 bleibt der häufigste Client-Fehler. Über alle von ChatGPT und Google zitierten URLs hinweg ist 404 Not Found der mit Abstand häufigste 4xx-Statuscode. Der Großteil der beobachteten Client-Fehler geht damit auf nicht existierende Seiten zurück.
  2. Andere 4xx-Statuscodes liefern zusätzlichen Kontext. Statuscodes wie 410 Gone oder 451 Unavailable for Legal Reasons deuten in der Regel darauf hin, dass Inhalte bewusst entfernt oder rechtlich eingeschränkt wurden. Diese Codes treten bei von Google zitierten URLs etwas häufiger auf. Wahrscheinlich ist dies auf Unterschiede in den zugrunde liegenden URL-Sets zurückzuführen und nicht auf eine gezielte Behandlung bestimmter Statuscodes.
  3. Bei ChatGPT treten weniger seltene Statuscodes auf. Einige seltene Codes wie 418 („I’m a teapot“) wurden ausschließlich bei URLs beobachtet, die von Googles Systemen zitiert wurden, nicht jedoch bei ChatGPT. Diese Fälle sind vermutlich Artefakte des Prüfprozesses: Einige Server antworteten auf unsere Requests mit Anti-Bot-Statuscodes, lieferten Googlebot jedoch reguläre 200-Antworten.

Weitere Fehler in ChatGPT-Antworten: Weiterleitungen (3xx) und Serverfehler (5xx)

Ein Großteil der Diskussionen zur Linkqualität konzentriert sich auf 404-Fehler und andere Client-seitige Probleme. Daneben gibt es jedoch weitere Fehlerkategorien, die sich ebenfalls auf die Nutzererfahrung auswirken können: Weiterleitungen (3xx) und Serverfehler (5xx). Sie sind weniger offensichtlich als klassische Broken Links, wirken sich aber dennoch auf die Nutzererfahrung aus.

Weiterleitungen (3xx)

Weiterleitungen werden häufig übersehen, da die Zielseite am Ende geladen wird. Dieses „am Ende“ hat jedoch seinen Preis. Jede Weiterleitung bedeutet:

  • eine zusätzliche Serveranfrage
  • höhere Ladezeiten
  • mehr potenzielle Fehlerquellen

Gerade bei mobilen Verbindungen oder langsamen Netzwerken werden diese Verzögerungen spürbar. Das kann Nutzer ausbremsen, frustrieren und sich negativ auf das Nutzungsverhalten auswirken.

Der folgende Vergleich zeigt, wie sich die Redirect-Raten zwischen von ChatGPT zitierten URLs und von Google zitierten URLs unterscheiden:

URL-Weiterleitungen in von ChatGPT und Google zitierten URLs

Wie die Daten zeigen, landen Nutzer bei von ChatGPT zitierten URLs 3–7-mal häufiger direkt auf der finalen Zielseite.

Auffällig ist zudem die Art der Weiterleitungen:

  • Unter den von ChatGPT zitierten Quellen finden sich überdurchschnittlich häufig permanente Redirects (301/308). Diese signalisieren, dass eine Seite dauerhaft verschoben wurde und strukturell stabil ist.
  • In den organischen Google-Ergebnissen hingegen dominieren temporäre Redirects (302/307).

Daraus lässt sich ableiten, dass ChatGPT bevorzugt URLs zitiert, die strukturell als „final“ erscheinen – auch wenn vereinzelt falsche Zielpfade genannt werden. In der Praxis bedeutet das weniger Weiterleitungen, kürzere Ladezeiten und einen direkteren Weg zur Zielseite.

Serverfehler (5xx)

Serverfehler (5xx-Statuscodes) zählen zu den schwerwiegendsten Problemen, da die Website selbst nicht in der Lage ist, eine Anfrage zu verarbeiten. Die folgende Übersicht zeigt die Verteilung von 5xx-Fehlern bei URLs, die von den analysierten Systemen zitiert wurden:

Serverfehler in von ChatGPT und Google zitierten URLs

Der Großteil dieser Fehler steht im Zusammenhang mit Cloudflare, darunter Timeouts, SSL-Handshake-Fehler und Gateway-Probleme. Auffällig ist, dass die organische Google-Suche den höchsten Anteil an Serverfehlern aufweist. Eine mögliche Erklärung ist die zeitliche Verzögerung zwischen Indexierung und Validierung: Seiten können zum Zeitpunkt des Crawlings erreichbar gewesen sein, waren jedoch zum Zeitpunkt unserer Überprüfung nicht mehr verfügbar.

Auch wenn Serverfehler über alle Systeme hinweg selten auftreten, unterstreichen sie die Bedeutung von Stabilität und Zuverlässigkeit im Web. Im Gegensatz zu einer Weiterleitung stellt ein Serverfehler keinen Umweg dar, sondern einen vollständigen Abbruch der Anfrage.

Methodik

Um zu analysieren, wie KI-Systeme Webinhalte zitieren und wie häufig dabei nicht erreichbare oder fehlerhafte URLs auftreten, haben wir eine vergleichende Analyse von ChatGPT und Googles Such- und KI-Systemen durchgeführt.

Für ChatGPT haben wir 100.000 Prompts ausgewertet, mit Fokus auf Long-Tail-Fragen. Aus den Antworten des Modells wurden sämtliche zitierten URLs extrahiert. Das resultierende Datenset umfasste 159.949 eindeutige URLs.

Als Vergleichsbasis haben wir zusätzlich 100.000 Keywords aus denselben Themenbereichen für drei Google-Systeme analysiert:

  • Organische Suche (SERP)
  • AI Overviews (AIO)
  • AI Mode (AIM)

Anschließend wurde jede eindeutige URL aus allen vier Systemen auf ihren HTTP-Statuscode überprüft:

  • 2xx: Seite lädt erfolgreich
  • 3xx: Weiterleitungen
  • 4xx: Client-seitige Fehler (z. B. 404 Not Found, 410 Gone)
  • 5xx: Server-seitige Fehler

Ein Teil der URLs lieferte einen 403-Statuscode („Forbidden“), wodurch eine inhaltliche Überprüfung nicht möglich war. Betroffen waren:

  • ChatGPT: 14.486 URLs (9,06 %)
  • AIO: 64.099 URLs (12,74 %)
  • AIM: 66.752 URLs (12,09 %)
  • SERP: 81.359 URLs (16,14 %)

Nach dem Ausschluss aller 403-Antworten umfasste das finale Datenset:

  • ChatGPT: 145.463 URLs
  • AIO: 438.903 URLs
  • AIM: 485.400 URLs
  • SERP: 422.814 URLs

Hinweis: Diese Analyse basiert auf der zum Zeitpunkt der Datenerhebung aktuellen Version von ChatGPT und bildet eine Momentaufnahme des Zitierverhaltens von KI-Systemen ab. Die erfassten HTTP-Statuscodes spiegeln den Zustand der URLs zu diesem Zeitpunkt wider. Da Webinhalte dynamisch sind, können sich Statuscodes im Zeitverlauf ändern. Ergebnisse können daher in früheren oder zukünftigen Versionen von ChatGPT abweichen.

Fazit

Hat ChatGPT das Problem halluzinierter Links gelöst?

Nicht vollständig. Aber es ist auch nicht mehr das Problem, das es früher war.

Der Großteil der von ChatGPT zitierten URLs ist heute erreichbar. 404-Fehler bleiben jedoch die zentrale Schwachstelle. Auch ein Anteil von 1–2 % kann sich bei hoher Nutzung spürbar auswirken.

Unterm Strich bleibt festzuhalten: Technisches SEO ist weiterhin wichtig. Kaputte Seiten sollten vermieden, Weiterleitungen sauber gepflegt und URLs konsistent gehalten werden. Gleichzeitig lohnt es sich, im Blick zu behalten, wie Inhalte in ChatGPT und anderen KI-Tools zitiert werden.

So bleibt der Content erreichbar und Nutzer landen nicht im Leeren.

Abonniere unseren Blog!

Erhalte Neuigkeiten, Fachartikel und Tipps zu SEO, SEA und Online Marketing in deinen Posteingang.

Danke!
Du bist erfolgreich für unseren Blog abonniert!
Bitte prüfe deine E-Mail, um die Anmeldung zu bestätigen.