KI-Sichtbarkeit

GEO und SEO: Websites optimieren für ChatGPT, Claude & Co.

Immer mehr Menschen fragen nicht mehr Google, sondern ChatGPT oder Claude. Wie Websites perspektivisch sichtbar bleiben, wenn die Antwort von einer KI kommt.

von Oli Feiler · 22. Juni 2026

Man hat in SEO investiert. Die Website rankt auf Seite eins, für Begriffe, die wirklich zählen. Der Dienstleister zeigt grüne Kurven. Alles scheint in Ordnung.

Dann fragt jemand ChatGPT, welche Agenturen in der Region auf CMS-Entwicklung für Verbände spezialisiert sind. Oder Perplexity, welche Praxis in der Stadt Sportmedizin mit Kassenzulassung anbietet. Die Antworten kommen in Sekunden, mit drei oder vier zitierten Quellen, überzeugend formuliert. Der eigene Name taucht nicht auf.

Das ist kein Ausreißer, sondern ein strukturelles Muster, das sich gerade durch alle Branchen zieht.

Was ist GEO? ...und was ist es nicht?

Generative Engine Optimization, kurz GEO, bezeichnet die Praxis, Inhalte und technische Infrastruktur so zu gestalten, dass KI-Systeme sie finden, verstehen und in ihren Antworten zitieren. Der Begriff ist noch jung, und der Markt einigt sich noch auf die Terminologie. LLMO (Large Language Model Optimization) und GAIO (Generative AI Optimization) meinen praktisch dasselbe; durchgesetzt hat sich GEO am breitesten.

Eine Abgrenzung lohnt sich allerdings bei einem verwandten Begriff: AEO, Answer Engine Optimization. AEO zielt darauf, dass eine Maschine aus einer Seite eine eindeutige Antwort herauslösen kann, etwa für Featured Snippets, Voice Search oder Antwortboxen. GEO zielt eine Stufe weiter darauf, als vertrauenswürdige Quelle in eine synthetisierte Antwort einbezogen und zitiert zu werden. Vereinfacht: AEO ist Antwortfähigkeit, GEO ist Quellenfähigkeit. In der Praxis überlappen beide stark, und Google ordnet sie ohnehin als Spielarten von SEO ein, nicht als eigene Disziplinen.

Konkret geht es um diese Plattformen: ChatGPT mit aktivierter Websuche, Perplexity, Googles AI Overviews, Bing Copilot, Gemini. Zusammen haben sie eine kritische Masse erreicht, die das Suchverhalten messbar verändert. ChatGPT zählt rund 900 Millionen wöchentlich aktive Nutzerinnen und Nutzer (1). Gartner prognostizierte bereits 2024, dass das Volumen klassischer Suchmaschinen bis 2026 um 25 Prozent sinken wird, weil KI-Chatbots und virtuelle Agenten zunehmend Suchanteile übernehmen (2). Capgemini hat 2025 erhoben, dass 58 Prozent der Verbraucherinnen und Verbraucher traditionelle Suchmaschinen für Produkt- und Anbieterrecherchen bereits durch KI-Tools ersetzt haben (3). Wer in diesen Systemen nicht vorkommt, existiert für einen wachsenden Teil seines Publikums schlicht nicht.

Genauso wichtig ist, was GEO nicht ist: ein Ersatz für klassisches SEO. Analysen zeigen konsistent, dass ein erheblicher Teil aller KI-Zitationen aus den organischen Google-Ergebnissen stammt. Wer bei Google nicht gefunden wird, taucht auch in KI-Antworten selten auf. Das Fundament bleibt dasselbe. Was sich verschiebt, sind die Regeln, nach denen darauf gebaut wird.

Den konzeptionellen Hintergrund dieser Verschiebung haben wir in Die stille Zielgruppe: Wenn KI beginnt, Websites zu lesen beschrieben: warum KI keine Gestaltung sieht, warum Autorität neu verhandelt wird und was das für digitale Infrastruktur bedeutet. Dieser Artikel ist die Fortsetzung und beantwortet die praktische Frage, was nun konkret zu tun ist.

Wie KI-Suche funktioniert: der Weg von der Frage zur Quelle

Der strukturelle Unterschied zu klassischen Suchmaschinen liegt im Mechanismus selbst. Googlebot crawlt, indexiert, rankt, und am Ende steht eine Liste von URLs. Der Nutzer entscheidet, wohin er klickt.

Generative Suchsysteme funktionieren anders. Sie rufen Dokumente ab, verarbeiten sie und synthetisieren daraus eine Antwort. Das geschieht meist über ein Prinzip namens RAG, Retrieval-Augmented Generation. Ein Retrievalmodul holt eine breite Auswahl potenziell relevanter Dokumente aus dem Index. Ein Reranking-Schritt bewertet diese nach Qualitäts- und Autoritätssignalen. Das Sprachmodell formuliert schließlich die Antwort und zitiert die Quellen, auf die es sich stützt.

Dieser dreistufige Prozess hat direkte Konsequenzen dafür, was sich überhaupt optimieren lässt. Im Retrieval entscheidet die technische Zugänglichkeit, also ob der Crawler die Seite überhaupt lesen kann und sie schnell genug rendert. Im Reranking entscheidet die Autorität: Gibt es Signale wie strukturierte Daten, externe Referenzen oder eine konsistente Markenentität, die auf Expertise und Vertrauenswürdigkeit hinweisen? Und in der Synthese entscheidet die Struktur, denn nur Kernaussagen, die klar formuliert sind, lassen sich direkt extrahieren und zitieren.

GEO setzt auf allen drei Ebenen an. Google formuliert in seiner eigenen Optimierungsdokumentation klar, dass es für AI Overviews keine separaten Spezialanforderungen gibt (4). Dieselben Grundlagen, die für klassisches SEO gelten, bleiben maßgeblich: technische Zugänglichkeit, relevante Inhalte, nachvollziehbare Autorität.

Wichtig ist noch ein technischer Unterschied bei den Wissensquellen. Trainingsdaten prägen das grundlegende Weltbild des Modells. Sie verändern sich langsam und erfordern eine langfristige Präsenz im Web. Echtzeit-Retrieval bezieht aktuelle Inhalte ein, und hier wirken technische und inhaltliche Optimierungen schneller. Die meisten der folgenden Maßnahmen zielen auf diese Retrieval-Ebene.

Technische Zugänglichkeit: Was KI-Crawler brauchen

Bevor Inhalte zitiert werden können, müssen sie gelesen werden. Das klingt trivial, ist es aber nicht. KI-Crawler arbeiten unter anderen Bedingungen als Googlebot und reagieren empfindlicher auf technische Hürden.

Wer crawlt? Und zu welchem Zweck?

Die entscheidende Frage ist nicht nur, ob KI-Crawler zugreifen dürfen, sondern welcher Crawler welchen Zweck erfüllt. Alle drei großen Anbieter unterscheiden zwischen mindestens drei verschiedenen Bots.

OpenAI betreibt OAI-SearchBot für die ChatGPT-Suche und Suchindexierung, GPTBot für das Crawling zu Trainings- und Modellverbesserungszwecken sowie ChatGPT-User für nutzerinitiierte Abrufe (5). Anthropic trennt ähnlich: ClaudeBot sammelt Inhalte für das Modelltraining, Claude-SearchBot verbessert die Suchqualität, Claude-User folgt nutzerinitiierten Anfragen (6). Perplexity arbeitet mit PerplexityBot für die Suchindexierung und Perplexity-User für direkte Nutzerabrufe (7).

Diese Unterscheidung ist keine Randnotiz. Für die Sichtbarkeit in KI-Suchergebnissen sind die jeweiligen Such-Bots entscheidend, also OAI-SearchBot, Claude-SearchBot und PerplexityBot. GPTBot und ClaudeBot betreffen primär die Frage, ob Inhalte in Trainingsdaten einfließen sollen.

Für Websitebetreiber heißt das: robots.txt bleibt relevant, aber die alte Logik „Crawler erlauben oder sperren" reicht nicht mehr aus. Es braucht eine bewusste Entscheidung darüber, ob Inhalte in KI-Suchergebnissen erscheinen dürfen, ob sie für Training verwendet werden sollen, und wie mit nutzerinitiierten Abrufen umzugehen ist. Sichtbarkeit und Kontrolle fallen nicht mehr automatisch zusammen, zumal Perplexity ausdrücklich schreibt, dass sein nutzerinitiierter Fetcher robots.txt-Regeln in der Regel ignoriert (7).

Eine sinnvolle Strategie unterscheidet deshalb nach Inhaltsarten. Öffentliche Fachartikel, Leistungsseiten und FAQ-Bereiche sollten für Such- und Antwortsysteme zugänglich sein. Interne Dokumente, geschützte Bereiche oder rechtlich sensible Inhalte gehören klar abgeschirmt. Der erste Schritt ist kein Optimierungstrick, sondern eine Bestandsaufnahme: Welche Bots greifen heute zu, welche werden blockiert, und entspricht das der eigenen Kommunikationsstrategie?

llms.txt — sinnvoll, aber kein Wunderschalter

Seit 2024 kursiert der Vorschlag einer Datei namens llms.txt: eine Markdown-Datei im Root-Verzeichnis, die KI-Systemen eine kuratierte Übersicht über wichtige Inhalte geben soll. Die Idee stammt von Jeremy Howard (Answer.AI) und ist von der Struktur her mit robots.txt verwandt, verfolgt aber das umgekehrte Ziel: nicht sperren, sondern priorisieren (8). Das Konzept ist nachvollziehbar und passt besonders gut zu dokumentationsreichen Websites, technischen Bibliotheken oder Wissenssammlungen, bei denen ein kompaktes Inhaltsverzeichnis für Maschinen tatsächlich hilfreich sein kann.

Als GEO-Hebel wird llms.txt derzeit allerdings überschätzt. Für Google Search ist die Lage eindeutig. Laut Googles eigener Optimierungsdokumentation wird die Datei für generative Suchfunktionen nicht als Signal verwendet (4). Auch bei anderen großen Anbietern ist eine offizielle Unterstützung bislang nicht bestätigt.

Wer llms.txt anlegt, macht nichts falsch. Die Datei ist schnell implementiert und schadet nicht. Sie ersetzt aber weder saubere HTML-Struktur noch crawlbare Inhalte, strukturierte Daten oder fachlich belastbare Texte. Praktisch gesprochen ist sie ein günstiger Zusatz, während die eigentliche Arbeit weiterhin in der Website selbst liegt.

Rendering und Seitenperformance

KI-Crawler arbeiten unter Zeitdruck. Googlebot kann geduldig auf JavaScript-Rendering warten, schnellere Crawlsysteme verlassen eine Seite jedoch, bevor das DOM vollständig aufgebaut ist. Server-seitiges Rendering ist für die KI-Zugänglichkeit deshalb im Vorteil. Eine TTFB unter 200 Millisekunden gilt als solider Richtwert.

Genauso wichtig bleibt saubere HTML-Semantik. Elemente wie <article>, <main> und <section> sowie eine korrekte Heading-Hierarchie von H1 bis H3 liefern die Struktursignale, mit denen Crawler Orientierung gewinnen. Fragment-Identifikatoren wie #was-ist-geo erlauben zielgenaue Abschnittsreferenzen und gehören zu den Gründen, warum gut gegliederte Artikel häufiger mit direkten Abschnittslinks zitiert werden.

Strukturierte Daten: JSON-LD

KI-Systeme lesen keine Seite wie ein Mensch. Sie versuchen, Bedeutung aus HTML zu extrahieren, was bei unstrukturierten Texten Interpretation erfordert und damit Spielraum für Fehler lässt. Strukturierte Daten schließen diese Lücke, indem sie Fakten direkt und maschinenlesbar codieren.

JSON-LD ist das von Google empfohlene Format und hat sich als Marktstandard durchgesetzt (9). Es sitzt in einem <script type=„application/ld+json“>-Tag im HTML-Head, vollständig unabhängig vom sichtbaren Inhalt, und lässt sich dadurch einfach pflegen und nachrüsten. Ein magischer KI-Rankingfaktor ist JSON-LD nicht, aber ein sauberer semantischer Klärungsmechanismus. Statt Bedeutung zu inferieren, bekommt ein System Fakten direkt aus dem Datengraph.

Die relevantesten Schema-Typen für die meisten Websites sind Organization (wer man ist, wo, womit), BlogPosting / Article (Autor, Datum, Thema), FAQPage (direkt extrahierbare Frage-Antwort-Paare), BreadcrumbList(Hierarchiekontext) und HowTo für strukturierte Anleitungen. Für Verbände kommt Event hinzu, für lokale Einrichtungen LocalBusiness mit spezifischen Feldern.

Ein Hinweis zum FAQPage-Schema. Für die Auffindbarkeit in KI-Antwortsystemen ist das Format sinnvoll, weil sich Frage-Antwort-Strukturen leicht extrahieren lassen. Als Hebel für sichtbare FAQ-Rich-Results bei Google taugt es für die meisten Websites seit 2023 jedoch nicht mehr, weil Google diese Darstellung auf bekannte Regierungs- und Gesundheitswebsites eingeschränkt hat (10). Inhaltlich und maschinell bleibt FAQPage relevant, als Rich-Result-Versprechen nicht.

Content-Strategie: Wie Inhalte zitierbar werden

Technische Zugänglichkeit ist notwendig, aber nicht hinreichend. Ob ein Inhalt in einer KI-Antwort landet, entscheidet vor allem, wie er geschrieben ist.

Answer-first-Struktur

KI-Systeme extrahieren bevorzugt den ersten klaren Satz nach einer Überschrift. Wer eine Frage im Titel stellt und dann drei Absätze Kontext voranstellt, bevor die eigentliche Antwort kommt, verliert den Extraktionswettbewerb gegen eine Seite, die direkt beginnt.

In der Praxis schneidet eine bestimmte Struktur besser ab: zuerst die Antwort, dann Kontext und Belege. Je Hauptabschnitt steht eine kompakte Kernaussage, die für sich allein funktioniert, ein Satz oder zwei, die den Abschnitt zusammenfassen, bevor er ihn entfaltet. Das ist das klassische Pyramidenprinzip journalistischen Schreibens, das heute nicht mehr nur für menschliche Leser gilt. Die Selbstreferenzialität ist dabei kein Zufall: Dieser Artikel ist nach denselben Prinzipien aufgebaut, die er beschreibt.

Semantische Dichte

Keyword-Dichte war ein Signal des frühen SEO. Im GEO-Kontext zählt etwas anderes, nämlich wie viele eindeutige Entitäten, Relationen und Kontextinformationen eine Seite enthält. Man kann das ihre semantische Dichte nennen.

Ein Beispiel macht den Unterschied greifbar. Der Satz „Wir bieten umfassende Accessibility-Expertise" ist für KI-Systeme nahezu unsichtbar, weil er nichts Spezifisches kodiert. „Wir prüfen Websites nach WCAG 2.1 Erfolgskriterien der Level A und AA" enthält dagegen eine Entität (WCAG 2.1), eine Relation (Prüfung), eine Handlung und ein Zielkriterium, also lauter Anhaltspunkte für die maschinelle Verarbeitung.

Konkrete, prüfbare Aussagen schlagen Marketingsprache. Die sprachliche Klarheit, die gute Texte ohnehin auszeichnet, wirkt im GEO-Kontext gleichzeitig als Struktursignal.

FAQs als Inhaltsformat

Strukturierte Frage-Antwort-Paare werden von Retrievalsystemen besonders effizient verarbeitet. Eine FAQ am Ende eines Artikels oder einer Leistungsseite, mit echten Nutzerfragen und knappen Antworten, erhöht die Wahrscheinlichkeit, in einer direkten KI-Antwort zitiert zu werden. Das gilt als Inhaltsformat unabhängig davon, ob das FAQPage-Schema in einem Google-Rich-Result sichtbar wird. Der inhaltliche Nutzen bleibt in jedem Fall.

Topical Authority vor Einzelseiten

Eine Seite, die ein Thema vollständig behandelt, ist für KI-Systeme wertvoller als zehn dünn belegte Einzelseiten. Das entspricht dem Cluster-Modell, das urbanstudio auch intern anwendet. Ein Hub-Artikel behandelt das Thema in der Breite, verknüpfte Snippets arbeiten einzelne Aspekte in der Tiefe aus.

Dieser Artikel ist selbst ein Beispiel dafür. Regelmäßige Updates zahlen zusätzlich ein, denn RAG-basierte Systeme bevorzugen aktuelle Inhalte. Ein Artikel, der einmal jährlich überarbeitet und mit aktuellen Daten angereichert wird, wird anders bewertet als einer, der seit Jahren unberührt steht.

E-E-A-T: Vertrauen in Maschinensprache

E-E-A-T steht für Experience, Expertise, Authoritativeness und Trustworthiness und war ursprünglich ein Framework für menschliche Google-Quality-Rater. Im GEO-Kontext wirkt es stärker als je zuvor, weil KI-Systeme dieselben Signale auswerten, um zu entscheiden, ob eine Quelle vertrauenswürdig genug zum Zitieren ist.

Praktisch bedeutet das einiges. Autorenbiografien sollten Expertise nachweisen, nicht bloß behaupten. Quellenangaben, Publikationsdaten und eigene Daten oder Fallbeispiele, die sich nirgendwo anders finden, stärken das Vertrauen. Eine Seite, die auf erkennbare Kompetenz zurückgeführt werden kann, gewinnt den Vertrauenswettbewerb gegen anonymen Content systematisch.

Autorenprofile lassen sich über das Person-Schema in JSON-LD maschinenlesbar machen, mit sameAs-Verknüpfungen zu LinkedIn oder Wikidata. Das knowsAbout-Property beschreibt Themenautorität explizit. Eine kleine technische Geste mit großem semantischem Effekt.

Entitäten: Das Unternehmen als Wissensknoten

Hinter GEO steht ein Modell, das sich von klassischem SEO grundlegend unterscheidet, das Entitätsmodell. KI-Systeme verstehen die Welt nicht als Sammlung von Seiten, sondern als Netz von Entitäten, also eindeutigen Konzepten, Orten, Personen, Organisationen und Produkten, und den Beziehungen zwischen ihnen.

Eine Organisation, die in diesem Modell als eigenständige, klar definierte Entität erkennbar ist, wird anders behandelt als eine, die als semantisches Rauschen in Textblöcken versteckt liegt.

Den Schlüssel bildet die Entity Consistency. Name, Beschreibung, Tätigkeitsfelder und Kategorisierung müssen über alle Kanäle hinweg konsistent sein, also auf der Website ebenso wie in Presseberichten, Branchenverzeichnissen und Social-Media-Profilen. Jede Inkonsistenz verwässert das Bild, das KI-Systeme von einer Organisation haben. Wer auf der eigenen Website „Digitalagentur für Verbände" schreibt, im Branchenverzeichnis aber als „Webentwicklung allgemein" gelistet ist, erzeugt Rauschen, das sich maschinell schwer auflösen lässt.

Das sameAs-Property im JSON-LD-Schema verbindet den eigenen Eintrag mit externen Autoritätsquellen wie einem LinkedIn-Profil, einem Wikidata-Eintrag oder einem relevanten Branchenverzeichnis. Für Verbände, Kammern und medizinische Einrichtungen ist das besonders relevant, weil sich ihre Organisations- und Themenautorität über genau diese Verbindungen maschinenlesbar machen lässt.

Ein Eintrag in Wikidata ist für die meisten Organisationen erreichbar und kostet nur Zeit. Er verankert die Organisation dauerhaft im Wissensgraph, auf den viele KI-Systeme zurückgreifen, und gehört zu den wenigen Maßnahmen, die direkt auf Trainingsdaten einwirken und nicht nur auf das Retrieval.

Messen: Neue Metriken für eine neue Sichtbarkeitslogik

Klassische SEO-Metriken wie Ranking-Positionen, organischer Traffic und Click-through-Rate erfassen GEO-Erfolg nur unvollständig. Eine KI-Zitation erzeugt oft keinen direkten Klick. Die Marke wird trotzdem erwähnt, empfohlen und in einen Kontext gesetzt, der sich auf Kaufentscheidungen auswirkt.

Gerade entstehen neue KPIs. Die Citation Frequency misst, wie oft die eigene Quelle in themenrelevanten KI-Antworten erscheint. Die AI Visibility Rate erfasst, in welchem Anteil entsprechender Abfragen die Marke genannt wird. Hinzu kommt die Tonalität der Erwähnung. Tools wie Profound, Superlines oder Goodie spezialisieren sich auf diese Messung, doch der Markt ist jung und die Methodiken entwickeln sich noch.

Der einfachste Einstieg kostet nichts. Man befragt ChatGPT, Perplexity und Gemini direkt mit relevanten Branchenfragen und beobachtet, ob und wie die eigene Website erscheint. Das liefert kein statistisch belastbares Bild, aber einen schnellen ersten Eindruck davon, wo man steht.

Für die tiefere Analyse lohnt ein Blick in die Server-Logs. OAI-SearchBot, Claude-SearchBot und PerplexityBot hinterlassen dort Spuren. Welche Seiten werden gecrawlt, wie oft, in welchem zeitlichen Abstand? Diese Daten zeigen, ob Crawler überhaupt zugreifen und welche Inhalte ihnen offenbar interessant erscheinen.

Beim Erwartungsmanagement gilt: GEO-Maßnahmen wirken nicht über Nacht. Strukturierte Daten, überarbeitete Inhalte und technische Verbesserungen entfalten ihre Wirkung über Wochen bis Monate. Der Zeithorizont entspricht eher dem von nachhaltigem SEO als dem von Performance-Marketing.

Drei Maßnahmen ohne Umweg

Der Weg in GEO ist kein Schalter, der umgelegt wird, sondern eine Richtung, die man schrittweise und mit klaren Prioritäten einschlägt.

robots.txt prüfen. Welche Bots sind aktuell gesperrt oder freigegeben, und war das eine bewusste Entscheidung? Besonders OAI-SearchBot, Claude-SearchBot und PerplexityBot sollten für öffentliche Inhalte zugänglich sein. Ein globales Crawl-Blocking, das ursprünglich für andere Zwecke gesetzt wurde, sperrt sie stillschweigend mit aus.

JSON-LD für Organization und BlogPosting. Wer noch kein strukturiertes Markup hat, startet hier. Organization definiert die Identität der Website, BlogPosting verknüpft Artikel mit Autoren und Datum. Beides ist schnell implementiert und wirkt auf mehreren Ebenen gleichzeitig.

FAQ-Sektion auf Leistungsseiten. Drei bis fünf echte Nutzerfragen, direkt beantwortet, am Ende der Seite. Als Inhaltsformat ist das konsistent und ohne großen Aufwand umzusetzen.

Den Rest, also die vollständige JSON-LD-Abdeckung, die Entitäts-Optimierung und den Content-Audit nach semantischer Dichte, kann man systematisch nachziehen. Wichtig ist vor allem, anzufangen.

GEO als Infrastruktur, nicht als Kampagne

GEO ist kein Paralleluniversum zum klassischen Web. Wer saubere Strukturen pflegt, nachvollziehbare Inhalte schreibt und technische Grundlagen ernst nimmt, ist bereits auf dem richtigen Weg und muss diese Qualitäten jetzt nur explizit für maschinelle Leser sichtbar machen.

Das Muster, das sich dabei abzeichnet, kennen wir aus dem Barrierefreiheits-Cluster. Vieles, was Screenreadern hilft, hilft auch KI-Crawlern. Vieles, was Menschen Orientierung gibt, macht Inhalte maschinell besser extrahierbar. Gute digitale Infrastruktur zahlt auf mehrere Konten gleichzeitig ein.

Die nächste Stufe bilden Agenten, die nicht nur lesen, sondern handeln. Sie setzen genau dort an, wo GEO endet. Was das bedeutet, haben wir in Von der API zur Agententopologie: MCP und A2A beschrieben.

Quellen

TechCrunch: ChatGPT reaches 900M weekly active users, Februar 2026.
Gartner: Gartner Predicts Search Engine Volume Will Drop 25% by 2026, Februar 2024.
Capgemini Research Institute: Consumer Trends Report, Januar 2025.
Google for Developers: Google's Guide to Optimizing for Generative AI Features on Google Search.
OpenAI: Overview of OpenAI Crawlers.
Claude Help Center: Does Anthropic crawl data from the web, and how can site owners block the crawler?
Perplexity: Perplexity Crawlers.
Answer.AI: /llms.txt - a proposal to provide information to help LLMs use websites, September 2024.
Google for Developers: Intro to How Structured Data Markup Works.
Google for Developers: Changes to HowTo and FAQ rich results, August 2023.

Mehr lesen...

Sichtbar bleiben, wenn KI antwortet.

Wir prüfen gemeinsam, ob Website, CMS und Inhaltsstrukturen so aufgebaut sind, dass sie für Menschen nutzbar und für Maschinen interpretierbar bleiben.

Marian Feiler, Projektmanager

KI-Sichtbarkeit prüfen KI-Blog