
Das Wichtigste in Kürze
Eine Studie. 10.000 Suchanfragen. 9 Methoden. Ein Ergebnis, das die Branche spaltete.
Im November 2023 veröffentlichten Forscher der Princeton University, des IIT Delhi und des Allen Institute for AI ein Paper mit dem Titel „GEO: Generative Engine Optimization“. Die Kernaussage: Mit den richtigen Optimierungen lässt sich die Sichtbarkeit in KI-generierten Antworten um bis zu 40 % steigern.
Die „bis zu 40 %“-Zahl wurde tausendfach zitiert — in Agentur-Pitches, auf Konferenzen, in LinkedIn-Posts. Was deutlich seltener zitiert wird: Welche 9 Methoden genau getestet wurden. Welche 3 davon funktionieren. Welche schadet. Und warum die Studie auch Kritik einstecken musste.
In diesem Artikel bekommst du den vollständigen Breakdown — mit allen Zahlen aus dem Paper, der Methodik, den branchenspezifischen Ergebnissen und einer ehrlichen Einordnung der Kritik.
Die wichtigsten Eckdaten auf einen Blick.
| Element | Detail |
|---|---|
| Titel | GEO: Generative Engine Optimization |
| Autoren | Aggarwal, Murahari, Rajpurohit, Kalyan, Narasimhan, Deshpande |
| Institutionen | Princeton University, IIT Delhi, Georgia Tech, Allen Institute for AI |
| Konferenz | KDD 2024 (ACM SIGKDD), Barcelona, August 2024 |
| Getestete Queries | 10.000 (GEO-bench Benchmark) |
| Domains | 25 (Health, Law, Science, Business, etc.) |
| Getestete Methoden | 9 Optimierungstechniken |
| Generative Engine | GPT-3.5-turbo (BingChat-Simulation) + Perplexity.ai |
| Metriken | Position-Adjusted Word Count (PWC), Subjective Impression (SI) |
Die Forscher simulierten den Workflow von Bing Chat: Für jede der 10.000 Suchanfragen wurden die Top-5-Google-Ergebnisse gescraped, die Inhalte mit einer der 9 Methoden optimiert und dann an GPT-3.5-turbo übergeben. Das Modell generierte eine Antwort mit Quellenangaben — und die Forscher maßen, wie oft und prominent jede Quelle zitiert wurde.
Zusätzlich wurden die Ergebnisse auf dem echten Perplexity.ai verifiziert — mit konsistenten Resultaten.
Die zentrale Metrik: Position-Adjusted Word Count (PWC) — eine Kombination aus Wortanzahl der Zitation und deren Position in der KI-Antwort. Je prominenter und ausführlicher eine Quelle zitiert wird, desto höher der Score.
Das Herzstück der Studie. Hier sind alle 9 getesteten Methoden mit ihren exakten Ergebnissen — sortiert nach Wirksamkeit.
| # | Methode | Was wurde gemacht? | PWC-Veränderung |
|---|---|---|---|
| 1 | Quotation Addition | Relevante Zitate von glaubwürdigen Quellen einfügen | +42,6 % |
| 2 | Statistics Addition | Quantitative Statistiken statt qualitativer Aussagen | +32,8 % |
| 3 | Fluency Optimization | Textfluss und Lesbarkeit verbessern | +28,7 % |
| 4 | Cite Sources | Quellenangaben von glaubwürdigen Quellen hinzufügen | +27,7 % |
| 5 | Technical Terms | Fachterminologie durchgehend einbauen | +18,5 % |
| 6 | Easy-to-Understand | Sprache vereinfachen | +13,8 % |
| 7 | Authoritative Tone | Überzeugender, autoritativer formulieren | +11,8 % |
| 8 | Unique Words | Ungewöhnliche, einzigartige Begriffe verwenden | +6,2 % |
| 9 | Keyword Stuffing | Mehr Keywords aus der Suchanfrage einbauen | −8,7 % |
Quelle: Aggarwal et al., Table 1, Princeton/KDD 2024

Das Muster ist eindeutig: Die Top-4-Methoden — Zitate, Statistiken, Lesbarkeit, Quellenangaben — steigern die KI-Sichtbarkeit um 27-43 %. Stilistische Änderungen (autoritärer Ton, Vereinfachung, Fachbegriffe) bringen moderate 6-19 %. Und die klassische SEO-Taktik Keyword Stuffing ist die einzige Methode mit negativem Ergebnis.
Die drei wirksamsten Methoden haben eines gemeinsam: Sie fügen überprüfbare Substanz hinzu.

Relevante Zitate von glaubwürdigen Quellen einbetten — das ist die stärkste Einzelmethode. Wenn ein Text ein direktes Zitat enthält, das die KI als verifizierbar und relevant einstuft, steigt die Wahrscheinlichkeit deutlich, dass dieser Text als Quelle in der KI-Antwort erscheint.
Konkrete Zahlen statt vager Aussagen. Statt „die meisten Unternehmen profitieren“ zu schreiben, funktioniert „73 % der Unternehmen verzeichneten innerhalb von 6 Monaten messbare Ergebnisse“ deutlich besser für KI-Zitierung.
Quellenangaben mit konkreten Referenzen. Wenn ein Text nicht nur eine Behauptung aufstellt, sondern die Quelle benennt — Studie, Autor, Jahr — wird er für KI-Modelle zitierbarer.
Die Studie zeigt auch: Methoden kombiniert wirken stärker als einzeln. Die beste Kombination war Fluency Optimization + Statistics Addition — sie übertraf jede Einzelmethode um +5,5 %. Cite Sources als Kombinations-Partner erzielte durchschnittlich +31,4 % Verbesserung.
Was alle Top-Methoden verbindet: Sie machen Content überprüfbar. KI-Modelle bevorzugen Inhalte, die sie verifizieren können — mit konkreten Zahlen, benannten Quellen und zitierbaren Aussagen. Das deckt sich mit dem, was Google unter E-E-A-T versteht.
Das deutlichste Ergebnis der Studie ist gleichzeitig das unbequemste.
Keyword Stuffing — mehr relevante Keywords aus der Suchanfrage in den Text einbauen — ist die einzige der 9 Methoden mit negativem Ergebnis: −8,7 %. Was bei klassischem SEO jahrelang als Basis-Taktik galt, schadet bei KI-Suchmaschinen aktiv.

KI-Modelle wie GPT-3.5, GPT-4 und Gemini sind darauf trainiert, natürliche Sprache zu verstehen. Texte mit unnatürlich hoher Keyword-Dichte werden als weniger vertrauenswürdig eingestuft. Das Modell erkennt: Dieser Text ist für eine Maschine geschrieben, nicht für einen Menschen.
Die Implikation ist grundlegend: Was bei Google-Rankings (zumindest historisch) funktioniert hat, ist bei KI-Suchmaschinen kontraproduktiv. Wer Content von klassischem SEO auf GEO umstellen will, muss den Fokus von Keywords auf Fakten verschieben.
Einen vollständigen Vergleich zwischen SEO- und GEO-Ansätzen findest du in unserem Artikel GEO vs. SEO: 10 Unterschiede.
Das vielleicht überraschendste Ergebnis der Studie.
Die Forscher analysierten, wie die Methoden bei unterschiedlich gut platzierten Websites wirken — von Rank 1 (Marktführer) bis Rank 5 (kaum sichtbar). Die Ergebnisse für Cite Sources:
| Google-Ranking | Sichtbarkeitsveränderung durch Cite Sources |
|---|---|
| Rank 1 (Marktführer) | −30,3 % |
| Rank 2 | +2,5 % |
| Rank 3 | +20,4 % |
| Rank 4 | +15,5 % |
| Rank 5 (kaum sichtbar) | +115,1 % |
Quelle: Aggarwal et al., Table 2, Princeton/KDD 2024

Websites, die bei Google auf Platz 5 stehen, können ihre KI-Sichtbarkeit um über 115 % steigern — während die Nummer 1 sogar Sichtbarkeit verliert. GEO nivelliert das Spielfeld. Du brauchst keine jahrelange Backlink-Geschichte und keine Premium-Domain. Du brauchst faktenbasierten, zitierbaren Content.
Für kleine und mittlere Unternehmen ist das eine echte Chance: Die Dominanz großer Marken in den traditionellen Suchergebnissen lässt sich bei KI-Suchmaschinen durchbrechen — mit der richtigen Content-Strategie.
Ähnliche Ergebnisse für Quotation Addition (Rank 5: +99,7 %) und Statistics Addition (Rank 5: +97,9 %) bestätigen das Muster: Je niedriger das Google-Ranking, desto größer das GEO-Potenzial.
Nicht jede Methode wirkt in jeder Branche gleich. Die Studie zeigt klare Unterschiede nach Themenbereich.
| Branche/Domain | Beste Methode | Warum |
|---|---|---|
| Recht & Regierung | Statistics Addition | Juristische Inhalte brauchen harte Zahlen und Referenzen |
| Geschichte & Gesellschaft | Quotation Addition + Authoritative | Historische Quellen und Expertenzitate besonders wertvoll |
| Gesundheit & Business | Fluency Optimization | Komplexe Themen verständlich darstellen bringt Zitierbarkeit |
| Fakten & Statements | Cite Sources | Verifizierbare Aussagen mit Quellen dominieren |
| Meinungs-/Debattenfragen | Statistics Addition | Zahlen verleihen Meinungen Gewicht und Überprüfbarkeit |
Quelle: Aggarwal et al., Table 3, Princeton/KDD 2024
Es gibt keine universelle GEO-Formel. Was in der IT-Branche funktioniert (Statistiken und Quellen), kann in einem historischen Kontext weniger wirksam sein als Expertenzitate. Die Studie zeigt: Die optimale GEO-Strategie ist branchenspezifisch.
Was jedoch branchenübergreifend gilt: Substanz schlägt Stil. In keiner einzigen Domain war Keyword Stuffing die beste Methode. Und in allen Domains zeigten faktenbasierte Ansätze (Zitate, Statistiken, Quellen) bessere Ergebnisse als stilistische Optimierungen.
Kein seriöser Artikel über diese Studie ohne die Gegenstimmen.
Jim Prosser, ein ehemaliger Google-Kommunikationsmanager, schrieb: „Die gesamte GEO-Kategorie existiert, weil Agenturen neue Dinge zum Verkaufen brauchen — nicht weil Kunden ein neues Problem haben.“ Und Lily Ray dokumentierte „koordinierte GEO-Desinformationskampagnen“, bei denen Tools Micro-Influencer bezahlten, um SEO-ist-tot-Narrative zu verbreiten.
Die Grundrichtung der Studie deckt sich mit unabhängigen Daten:
Die Studie hat methodische Schwächen. Aber ihre Kernaussage — faktenbasierter Content mit Quellen und Statistiken funktioniert besser als Keyword-optimierter Content — wird von unabhängigen Quellen bestätigt.
Drei konkrete Handlungsempfehlungen aus den Daten.
Die Top-3-Methoden der Studie sind gleichzeitig die einfachsten umzusetzen. Jeder Fachartikel, jede Landingpage, jeder Blogartikel sollte konkrete Zahlen mit benannten Quellen enthalten. Nicht weil die Princeton-Studie es sagt — sondern weil es sowohl für Google-Rankings (E-E-A-T) als auch für KI-Zitierung (GEO) funktioniert.
Wenn du Content hast, der primär auf Keyword-Dichte optimiert ist, schadet er dir möglicherweise bei KI-Suchmaschinen aktiv. Überarbeite solche Inhalte mit Fokus auf Fakten, Quellen und Lesbarkeit statt auf Keyword-Häufigkeit.
Die +115 %-Steigerung für Rank-5-Websites zeigt: GEO bietet kleinen und mittleren Unternehmen eine Chance, die bei klassischem SEO nicht existiert. Du brauchst keine Premium-Domain und keine tausenden Backlinks — du brauchst Content, den KI-Modelle als vertrauenswürdig einstufen und zitieren wollen.
Wie du GEO und SEO gleichzeitig in deiner Strategie umsetzt, zeigen wir in unserem Artikel zur GEO-Strategie 2026. Und einen Überblick über alle GEO-relevanten Zahlen findest du in unserem GEO-Statistiken-Artikel.
Die Princeton-Studie ist nicht perfekt. Die Methodik hat Schwächen, die Kritik ist teilweise berechtigt, und die „bis zu 40 %“-Zahl wird von der Branche inflationär verwendet.
Aber die Grundaussage stimmt — und wird von unabhängigen Daten bestätigt:
Die Studie hat den Begriff GEO geprägt und eine ganze Branchenkategorie geschaffen. Ob man das als Revolution oder als Rebranding bestehender Best Practices sieht — die Daten zeigen: Faktenbasierter, zitierbarer Content ist der Schlüssel für Sichtbarkeit in der KI-Suche.
Wenn du wissen willst, wie sich SEO und GEO konkret unterscheiden, lies unseren Artikel GEO vs. SEO: 10 Unterschiede. Und wenn du prüfen willst, ob GEO für dein Unternehmen relevant ist, fordere eine kostenlose GEO-Potenzialanalyse an.
Die Princeton GEO-Studie (Aggarwal et al., KDD 2024) ist die erste wissenschaftliche Untersuchung zur Optimierung von Inhalten für KI-Suchmaschinen. Forscher der Princeton University, des IIT Delhi und des Allen Institute for AI testeten 9 Optimierungsmethoden auf 10.000 Suchanfragen und maßen, wie sich die Sichtbarkeit in KI-generierten Antworten verändert.
Die drei wirksamsten Methoden laut der Studie: Quotation Addition (relevante Zitate einfügen, +42,6 %), Statistics Addition (konkrete Statistiken statt vager Aussagen, +32,8 %) und Cite Sources (Quellenangaben hinzufügen, +27,7 %). Alle drei fügen überprüfbare Substanz zum Content hinzu.
Ja. Keyword Stuffing ist die einzige der 9 getesteten Methoden mit negativem Ergebnis: −8,7 % Sichtbarkeit in KI-Antworten. KI-Modelle erkennen unnatürlich keyword-reiche Texte und stufen sie als weniger vertrauenswürdig ein. Was bei klassischem SEO historisch funktionierte, ist bei GEO kontraproduktiv.
Ja, deutlich. Die Studie zeigt: Websites auf Google-Rang 5 steigerten ihre KI-Sichtbarkeit um +115 % mit Cite Sources, während Rang-1-Websites −30 % verloren. GEO demokratisiert Sichtbarkeit — kleinere Unternehmen können große Marken in KI-Antworten überholen, wenn ihr Content faktenbasiert und zitierbar ist.
Die Studie hat methodische Stärken und Schwächen. Stärken: 10.000 Queries, 25 Domains, Peer-Review bei KDD 2024, Verifizierung auf Perplexity.ai. Schwächen: Erfundene Daten erlaubt, nur 5 Quellen pro Query, ICLR-Ablehnung. Die Grundrichtung — faktenbasierter Content wirkt besser als Keyword-optimierter — wird jedoch von unabhängigen Quellen bestätigt.
PWC ist die Hauptmetrik der Studie. Sie kombiniert zwei Faktoren: Wie viele Wörter aus deiner Quelle in der KI-Antwort zitiert werden (Wortanzahl) und wo sie in der Antwort erscheinen (Position). Je prominenter und ausführlicher eine Quelle zitiert wird, desto höher der PWC-Score.
Die Studie testete primär auf einer simulierten BingChat-Umgebung (GPT-3.5-turbo). Zusätzlich wurden die Methoden auf dem echten Perplexity.ai verifiziert — mit konsistenten Ergebnissen (bis zu +37 % Verbesserung). Tests auf Google AI Overviews, ChatGPT Search und Claude wurden nicht durchgeführt.
GEO (Generative Engine Optimization) optimiert Inhalte dafür, in KI-generierten Antworten zitiert zu werden — von ChatGPT, Perplexity oder Google AI Overviews. SEO optimiert für Google-Rankings und Klicks. Beide bauen auf denselben Grundlagen auf (E-E-A-T, Content-Qualität), aber GEO fokussiert auf faktenbasierte, zitierbare Textpassagen statt auf Keywords und Backlinks.