
Das Wichtigste in Kürze
ChatGPT Quellen stammen aus zwei klar getrennten Töpfen. Erstens aus dem Trainingswissen: Beim Training hat das Sprachmodell Muster aus Milliarden Texten gelernt – dieses Wissen ist statisch, endet am sogenannten Knowledge-Cutoff und erzeugt keine anklickbaren Quell-Links. Zweitens aus der Live-Websuche: Moderne KI-Suchen wie ChatGPT Search, Perplexity und die Google AI Overviews rufen zur Laufzeit echte Webseiten ab und zeigen sie als Quelle an. Erst diese zweite Mechanik produziert die Quellen, die du im Antworttext siehst.
Wichtig vorweg, weil beides oft verwechselt wird: Es gibt einen Unterschied zwischen „ChatGPT eine Quelle angeben“ (also wie du ChatGPT in einer Hausarbeit zitierst) und „woher ChatGPT seine Quellen nimmt“ (die Herkunft der Informationen). Dieser Beitrag erklärt die Herkunft – und warum Reddit und Wikipedia dabei eine so unterschiedliche Rolle spielen.
Die kurze Antwort: Jede KI bevorzugt einen anderen Quelltyp. ChatGPT zieht am stärksten aus Wikipedia, Perplexity und die Google AI Overviews vor allem aus Reddit. Wer in KI-Antworten auftauchen will, muss deshalb verstehen, aus welchem Quelltyp die jeweilige KI schöpft.
Der häufigste Denkfehler lautet: „ChatGPT durchsucht für jede Antwort das Internet.“ Das stimmt nur manchmal. Tatsächlich gibt es zwei grundverschiedene Wege, auf denen eine KI an Informationen kommt – und nur einer davon liefert nachprüfbare Quell-Links.
| Mechanik | Wie sie funktioniert | Quell-Link? |
|---|---|---|
| Trainingswissen (parametrisch) | Das Modell hat beim Training Muster aus riesigen Textmengen gelernt und sagt das jeweils wahrscheinlichste nächste Wort voraus. Wissen ist statisch und endet am Knowledge-Cutoff. | Nein – das Modell „weiß“, kann aber nicht sagen, aus welcher einzelnen Seite. |
| Live-Retrieval (RAG / Websuche) | Vor der Antwort wird eine echte Web- oder Index-Suche ausgeführt; die gefundenen Seiten werden zusammengefasst und als Quelle verlinkt. Das nutzen ChatGPT Search, Perplexity und AI Overviews. | Ja – die zitierten Seiten erscheinen sichtbar in der Antwort. |
Ein Sprachmodell speichert keine Webseiten, sondern Wahrscheinlichkeiten zwischen Wörtern. Es kann den Inhalt eines Wikipedia-Artikels exzellent wiedergeben, ohne den Artikel selbst „vorliegen“ zu haben. Deshalb erfindet ein Modell ohne Websuche manchmal Quellen, die es so nie gab – ein Effekt, den man Halluzination nennt. Verlässliche, anklickbare Quellen entstehen erst, wenn die KI live sucht.
Wenn Perplexity dir nummerierte Quellen unter der Antwort zeigt oder die Google AI Overviews Webseiten verlinken, läuft im Hintergrund eine klassische Suche. Die KI formuliert die Antwort aus den Top-Treffern dieser Suche. Damit gilt eine zentrale Konsequenz: Wer nicht im zugrunde liegenden Suchindex auffindbar ist, kann auch nicht zitiert werden – egal wie gut der Inhalt ist.
Hier wird es konkret. Eine Analyse von Profound über 680 Millionen KI-Zitate (Zeitraum August 2024 bis Juni 2025) zeigt: Die KI-Systeme bevorzugen unterschiedliche Quelltypen – und der Kontrast zwischen Reddit und Wikipedia ist der deutlichste.
Wie weit die Indizes auseinanderliegen, zeigt eine zweite Zahl: Nur etwa 11 % der zitierten Domains überschneiden sich zwischen ChatGPT und Perplexity (Quelle: AuthorityTech, 2026). Anders gesagt: Eine einzige Content-Strategie gewinnt nicht automatisch alle KI-Oberflächen. Du optimierst pro Engine für einen anderen Quelltyp.
Die Prozentwerte wirken klein, weil sich Zitate über zehntausende Domains verteilen – 7,8 % für eine einzelne Domain bedeutet hier eine klare Dominanz, keine Randnotiz. Entscheidend ist nicht die absolute Höhe, sondern die jeweils meistzitierte Einzelquelle: Sie ist bei ChatGPT Wikipedia, bei Perplexity und den AI Overviews Reddit. Die Richtung ist damit eindeutig belegt: ChatGPT = Wikipedia-lastig, Perplexity und AI Overviews = Reddit-lastig.
Diese Tabelle fasst zusammen, woher die wichtigsten KI-Suchen ihre Informationen primär nehmen – als zitierfähige Übersicht:
| KI-System | Bevorzugte Quelltypen | Meistzitierte Einzelquelle |
|---|---|---|
| ChatGPT (Search) | Enzyklopädien, redaktionelle News, etablierte Wissensseiten | Wikipedia (7,8 %), Reddit nur ~1,8 % |
| Perplexity | Community-Diskussionen, Foren, Erfahrungs- und Vergleichsinhalte | Reddit (6,6 %), Wikipedia nicht in Top-Quellen |
| Google AI Overviews | Reddit, YouTube, Foren plus die organischen Top-Treffer der Google-Suche | Reddit (2,2 %), Wikipedia ~0,6 % |
Quelle der Zahlen: Profound, Analyse von 680 Mio. KI-Zitaten, August 2024 bis Juni 2025. Die genauen Anteile verschieben sich laufend, das Muster ist jedoch stabil: Wer für ChatGPT gefunden werden will, braucht einen anderen Quelltyp-Fußabdruck als für Perplexity.
Wie du daraus eine plattformspezifische Strategie machst, vertiefen wir in unseren How-tos zu Sichtbarkeit in ChatGPT und zur Optimierung für Perplexity. Dieser Beitrag bleibt bei der Frage davor: woher die Quellen kommen.
Reddit ist quer über ChatGPT, Perplexity, den Google AI Mode und die AI Overviews hinweg die einflussreichste einzelne Quelle – nach Branchenanalysen taucht Reddit in der Größenordnung von 40 % aller KI-Zitate über die großen Engines hinweg auf (Quelle: Semrush / Search Engine Land, 2025). Dafür gibt es drei handfeste Gründe:
Das erklärt auch, warum Review- und Vergleichsseiten (etwa Bewertungsportale oder Branchen-Communities) in KI-Antworten überproportional auftauchen: Sie bündeln genau die Erfahrungs- und Vergleichssignale, nach denen Retrieval-Systeme suchen.
Wenn ChatGPT antwortet, ohne eine Quelle zu verlinken, liegt das fast immer an der Mechanik von oben: Die Antwort kam aus dem Trainingswissen, nicht aus einer Live-Suche. Drei typische Fälle:
OAI-SearchBot oder PerplexityBot per robots.txt oder Firewall blockiert, kann die KI sie nicht zitieren.Für dich als Website-Betreiber ist der zweite Punkt der wichtigste: Erreichbarkeit für KI-Crawler ist die Grundbedingung, um überhaupt als Quelle in Frage zu kommen. Die Details dazu stehen in unserem Leitfaden zur robots.txt für KI-Crawler.
Aus der Quell-Mechanik folgt eine klare Handlungslogik. Du wirst nicht zitiert, indem du „die KI optimierst“, sondern indem du in den Quelltypen präsent bist, aus denen die jeweilige KI schöpft.
Den übergeordneten Rahmen – also die gesamte Disziplin, in KI-Antworten sichtbar zu werden – beschreiben wir im Pillar-Beitrag zur Generative Engine Optimization.
Zwei ehrliche Einordnungen, damit die Erwartung stimmt:
KI-Zitate sind keine buchbare Anzeigenfläche. Du kannst dich nicht in eine KI-Antwort „einkaufen“. Sichtbarkeit entsteht indirekt über deinen Quelltyp-Fußabdruck und baut sich über Wochen auf – nicht über Nacht. Das deckt sich mit den Daten von oben: KI ist bei Empfehlungen viel selektiver als Google.
Wie selektiv, zeigt der SOCi 2026 Local Visibility Index (rund 350.000 Standorte): KI empfiehlt nur 1,2 % der lokalen Orte bei ChatGPT und 7,4 % bei Perplexity – gegenüber 35,9 % Sichtbarkeit im Google-Local-3-Pack. In einer KI-Antwort gibt es eben keine Linkliste mit zehn Plätzen, sondern nur ein bis drei Empfohlene.
Quell-Anteile schwanken. Wovon eine KI zitiert, hängt an Index- und Lizenzlage – und die ändert sich. Als Reddit im Oktober 2025 rechtlich gegen Perplexity vorging, brach Perplexitys Reddit-Zitatanteil drastisch ein und wurde teils durch YouTube ersetzt. Quell-Mechanik ist also kein statischer Zustand, sondern beweglich. Genau deshalb misst man KI-Sichtbarkeit laufend pro Plattform – wie das geht, steht in unserem Beitrag zur Messung der KI-Sichtbarkeit. Und auch der Umfang von KI-Antwortflächen wächst: AI Overviews tauchen je nach Studie bei einem erheblichen Anteil der Suchanfragen auf (BrightEdge: rund 48 % der getrackten Queries, +58 % im Jahresvergleich; andere Studien messen je nach Keyword-Set und Markt deutlich niedriger).
ChatGPT Quellen, Perplexity-Quellen und AI-Overview-Quellen kommen aus zwei Mechaniken – statischem Training und Live-Retrieval – und jede KI bevorzugt einen anderen Quelltyp. ChatGPT lebt von Wikipedia, Perplexity und die AI Overviews von Reddit. Wer in den Antworten vorkommen will, muss nicht „die KI austricksen“, sondern im richtigen Quelltyp echt präsent sein: enzyklopädischer Kontext für ChatGPT, Community für Perplexity, plus eine eigene zitierfähige Seite für alle.
Der schnellste erste Schritt: herausfinden, ob und wo du heute schon zitiert wirst. Den Überblick über mehrere Modelle liefert unser kostenloser KI-Check; wer KI-Sichtbarkeit systematisch aufbauen will, findet die Umsetzung in unserer GEO-Agentur.
ChatGPT bezieht Informationen aus zwei Quellen: dem statischen Trainingswissen (Muster aus den Trainingsdaten, ohne anklickbaren Link) und – wenn die Websuche aktiv ist – aus einer Live-Suche zur Laufzeit, deren gefundene Seiten als Quelle verlinkt werden. Am häufigsten zitiert ChatGPT dabei Wikipedia (rund 7,8 Prozent aller Zitate, Profound 2025).
Weil die Antwort dann aus dem Trainingswissen kommt und nicht aus einer Live-Suche. Ein Sprachmodell speichert keine Webseiten, sondern Wort-Wahrscheinlichkeiten – es kann den Inhalt wiedergeben, ohne die einzelne Quelle zu kennen. Anklickbare Quellen entstehen erst, wenn die KI live im Web sucht (Retrieval).
Perplexity stützt sich stark auf eine Live-Websuche und bevorzugt Community-Diskussionen. Die meistzitierte Einzelquelle ist Reddit (rund 6,6 Prozent aller Zitate, Profound 2025); Wikipedia taucht in den Top-Quellen praktisch nicht auf. Damit ist Perplexity nahezu das Gegenteil von ChatGPT, das vor allem Wikipedia nutzt.
Reddit ist über alle großen KI-Engines hinweg die einflussreichste einzelne Quelle. Gründe sind Lizenzverträge (zum Beispiel der Reddit-Google-Deal über rund 60 Mio. US-Dollar pro Jahr ab Februar 2024), die echte, menschliche Diskussion mit Erfahrungswissen und die ständige Aktualität über fast alle Themen hinweg.
Nein. Jede KI nutzt einen anderen Index und bevorzugt andere Quelltypen. Zwischen ChatGPT und Perplexity überschneiden sich nur rund 11 Prozent der zitierten Domains. Deshalb sollte man pro Plattform getrennt optimieren und messen, statt eine einzige Strategie für alle KI-Suchen anzunehmen.
Nein. KI-Zitate sind keine buchbare Anzeigenfläche. Sichtbarkeit entsteht indirekt über den passenden Quelltyp-Fußabdruck – enzyklopädischer Kontext für ChatGPT, echte Community-Präsenz für Perplexity, plus eine eigene zitierfähige Seite – und baut sich über Wochen auf. Die Quell-Anteile schwanken zudem mit der Index- und Lizenzlage.
Indem du in den richtigen Quelltypen präsent bist: konsistenter, redaktioneller und enzyklopädischer Kontext für ChatGPT, authentische Foren- und Reddit-Beiträge für Perplexity und die AI Overviews, dazu eine eigene Website mit klaren Frage-Antwort-Strukturen, belegten Zahlen und strukturierten Daten. Voraussetzung ist, dass KI-Crawler deine Seiten überhaupt erreichen dürfen.