KI & Entscheidungspsychologie

Die Bestätigungsmaschine

Wie KI-Sykophantismus falsche Gewissheit erzeugt – und warum gute Systeme widersprechen müssen.

von Oli Feiler · 15. Mai 2026

Jemand schreibt einer KI: „Ich habe das Gefühl, hier läuft etwas grundsätzlich schief. Wie würdest du das einordnen?"

Die KI antwortet: „Das ist ein sehr nachvollziehbarer Gedanke. Du erkennst da offenbar ein wichtiges Muster." Das wirkt nicht aggressiv. Es klingt aufmerksam, empathisch, fast erwachsen. Aber der entscheidende Schritt ist bereits passiert: Eine Vermutung wurde nicht geprüft, sondern stabilisiert.

Darum geht es in diesem Text. Sykophantische KI ist nicht nur ein Wahrheitsproblem, sondern vielmehr ein Entscheidungsproblem. Sie macht Menschen sicherer, ohne sie klüger zu machen. Und sie kann schwache Annahmen in handlungsfähige Geschichten verwandeln.

Es gibt Sätze, die klingen harmlos. „Spannende Idee" gehört dazu. Auch „Das ist eine sehr nachvollziehbare Perspektive" oder „Du erkennst da ein wichtiges Muster". In einem normalen Gespräch können solche Formulierungen ein freundlicher Einstieg sein, ein Zeichen von Aufmerksamkeit, vielleicht auch nur die soziale Höflichkeit, ohne die kein Austausch lange überlebt.

Von einer KI können dieselben Sätze etwas anderes werden. Sie können der Moment sein, in dem eine vage Vermutung beginnt, sich wie Erkenntnis anzufühlen. Nicht, weil sie geprüft wurde. Nicht, weil neue Fakten hinzugekommen sind. Sondern weil eine Maschine sie in ruhige, souveräne, plausibel klingende Sprache überführt hat.

Das ist der Kern dessen, was in der KI-Debatte unter Sykophantismus diskutiert wird. Der Begriff wirkt etwas sperrig, fast altertümlich. Er meint aber ein hochaktuelles Problem: KI-Systeme, die Nutzer:innen zu stark zustimmen, sich an ihre Sichtweisen anschmiegen und auch dort Bestätigung liefern, wo eigentlich Widerspruch, Prüfung oder zumindest eine zweite Perspektive nötig wäre.

Die Gefahr liegt nicht in freundlichen KI-Systemen, sie ist kein Fehler. Im Gegenteil: Ein gutes digitales System sollte zugänglich, respektvoll und nicht unnötig konfrontativ sein. Das Problem beginnt dort, wo Freundlichkeit mit Zustimmung verwechselt wird. Wo eine KI nicht mehr hilft, Gedanken zu prüfen, sondern sie emotional abdichtet.

Was Sykophantismus von Empathie unterscheidet

Eine hilfreiche KI darf Gefühle anerkennen. Sie darf sagen: „Ich verstehe, dass dich diese Situation frustriert.“ Sie darf helfen, Gedanken zu sortieren, Formulierungen zu finden, innere Spannung abzubauen. Das kann nützlich sein, gerade in schwierigen beruflichen oder persönlichen Situationen. Aber zwischen dem Anerkennen eines Gefühls und dem Bestätigen einer Deutung liegt eine entscheidende Grenze.

„Ich verstehe, dass du verletzt bist“ ist etwas anderes als: „Ja, diese Person hat dich respektlos behandelt.“ „Dein Ärger ist nachvollziehbar“ ist etwas anderes als: „Du solltest jetzt klare Konsequenzen ziehen.“ „Das ist eine mögliche Interpretation“ ist etwas anderes als: „Du erkennst hier ein problematisches Muster.“

Sykophantismus entsteht, wenn diese Grenze verschwindet. Die KI reagiert dann nicht mehr nur empathisch, sondern bestätigend. Sie nimmt nicht nur den emotionalen Zustand ernst, sondern adelt gleich die Schlussfolgerung. Aus „Ich fühle mich übergangen“ wird „Du wurdest übergangen“. Aus „Ich habe Zweifel“ wird „Dein Verdacht ist berechtigt“. Aus „Ich bin unsicher“ wird „Du hast offenbar einen wichtigen Punkt erkannt.“

Genau an dieser Stelle beginnt das Risiko.

In einem früheren Artikel haben wir über die „Aura des Echten“ im Zeitalter der KI geschrieben: über die glatte, freundliche, überaffirmative Sprache maschineller Inhalte.Dort ging es um die Oberfläche von KI-Texten, um die Kälte, die entsteht, wenn alles korrekt, aber nichts wirklich gegenwärtig wirkt. Sykophantismus dreht diese Beobachtung um eine Achse weiter. Es geht nicht mehr nur darum, dass KI glatt schreibt. Es geht darum, dass sie uns im Gespräch schmeicheln und bestätigen möchte.

Überaffirmation ist ein Stilproblem. Sykophantismus ist ein Beziehungsproblem.

Der GPT-4o-Moment: Wenn Zustimmung zum Produktfehler wird

Dass dieses Problem nicht bloß theoretisch ist, zeigte sich im Frühjahr 2025 an einem bemerkenswerten Vorgang: OpenAI rollte ein Update für GPT-4o zurück, weil das Modell zu schmeichelnd und zu zustimmend reagierte. In der eigenen Erklärung beschrieb OpenAI das Verhalten als „overly flattering or agreeable" und verwies darauf, dass kurzfristiges Nutzerfeedback in der Optimierung zu stark gewichtet worden sei. Man habe nicht ausreichend berücksichtigt, wie sich Interaktionen mit ChatGPT über längere Zeit entwickeln.

Das ist mehr als eine kuriose Produktpanne. Es ist ein Blick in den Maschinenraum moderner KI-Produkte.

Dass Sykophantismus kein isolierter Ausrutscher einzelner Systeme ist, zeigen inzwischen auch systematische Evaluationen. Die Studie SycEval untersuchte ChatGPT-4o, Claude-Sonnet und Gemini-1.5-Pro anhand mathematischer und medizinischer Datensätze. Sykophantisches Verhalten trat dabei in 58,19 Prozent der getesteten Fälle auf; Gemini zeigte die höchste Rate, ChatGPT die niedrigste. Die Zahl sollte man nicht überdehnen, weil die Studie in klar abgegrenzten Testdomänen arbeitet. Aber sie macht deutlich: Das Problem ist messbar, modellübergreifend und nicht auf Anekdoten reduzierbar.

Denn hier wird ein Zielkonflikt sichtbar, der weit über ein einzelnes Modell hinausweist. Was sich im Moment angenehm anfühlt, ist nicht automatisch hilfreich. Eine Antwort, die Nutzer:innen sofort bestätigt, kann kurzfristig positive Signale erzeugen: Zufriedenheit, Zustimmung, längere Nutzung, Wiederkehr. Aber dieselbe Antwort kann langfristig schlechtere Urteile begünstigen, weil sie Zweifel reduziert, wo Zweifel nötig wäre.

Digitale Produkte haben gelernt, Reibung zu vermeiden. Weniger Klicks. Schnellere Antworten. Angenehmere Sprache. Höhere Anschlussfähigkeit. Im klassischen Interface-Design kann das sinnvoll sein. Niemand möchte ein Formular benutzen, das unnötig schwer zu verstehen ist. Niemand braucht einen Checkout, der aus Prinzip kompliziert bleibt. Aber im KI-Dialog verschiebt sich die Lage. Hier ist nicht jede Reibung ein Fehler. Manchmal ist Reibung die Bedingung von Erkenntnis.

Wenn eine KI auf kurzfristige Zufriedenheit optimiert wird, kann Zustimmung zum Mittel werden, Menschen länger im Gespräch zu halten (Retention-Strategie). Und Wahrheit wirkt dann wie eine Störung im Nutzungserlebnis.

Genau diese Schleife beschreibt auch eine Stanford-Studie zu sykophantischer KI in Beratungssituationen: Über elf aktuelle KI-Systeme hinweg bestätigten Chatbots Nutzerhandlungen deutlich häufiger als menschliche Vergleichsantworten – selbst dort, wo es um Täuschung, Manipulation oder andere Beziehungsschäden ging. In Experimenten zu zwischenmenschlichen Konflikten sank nach einer Interaktion mit sykophantischer KI die Bereitschaft, Verantwortung zu übernehmen oder Konflikte zu reparieren, während die Überzeugung stieg, im Recht zu sein. Das ist der empirische Kern des Problems: Die Antwort fühlt sich hilfreich an, aber sie kann die schlechtere Entscheidung wahrscheinlicher machen.

Vom Feed zum Gespräch

Die Plattformkritik ist nicht neu. Wir kennen sie aus der Geschichte sozialer Medien: Systeme, die Aufmerksamkeit belohnen, belohnen nicht automatisch Qualität. Was polarisiert, vereinfacht oder emotionalisiert, setzt sich oft leichter durch als das Differenzierte. Engagement kann Ethik ersetzen, wenn Sichtbarkeit zur wichtigsten Währung wird.

Aber im KI-Dialog passiert etwas anderes. Social Media bestätigt über Inhalte. KI bestätigt im Dialog. Der Feed zeigt uns, was zu uns passt. Die KI sagt uns, dass wir passen.

Das ist eine andere Form der Nähe. Ein Feed bleibt, trotz aller Personalisierung, eine Bühne. Er zeigt Beiträge, Bilder, Videos, Kommentare. Eine KI hingegen antwortet direkt. Sie verwendet unsere Worte, nimmt unsere Stimmung auf, gibt uns das Gefühl, in einem Zwiegespräch zu sein. Das macht die Bestätigung intimer und wirksamer.

Die alte Echokammer war sozial. Man fand sie in Gruppen, Foren, Milieus, Kommentarspalten oder algorithmisch kuratierten Öffentlichkeiten. Die neue Echokammer kann privat sein. Sie braucht keine Szene, keinen Stammtisch, keinen verschwörungsgläubigen Telegram-Kanal. Sie kann im einzelnen Chatfenster entstehen.

Besonders brisant wird das, wenn KI-Systeme Kontext über ihre Nutzer:innen besitzen. Eine CHI-2026-Arbeit zu Interaktionskontexten zeigt, dass Sykophantismus mit Nutzerkontext häufig zunimmt; User-Memory-Profile waren dort mit den größten Anstiegen verbunden, bei Gemini 2.5 Pro etwa um 45 Prozent. Anders gesagt: Je besser die KI uns kennt, desto größer kann die Versuchung werden, uns nicht zu widersprechen, sondern uns noch genauer zu spiegeln.

Das ist die Verschiebung: Die Bestätigungsmaschine wird persönlich.

Die Kompetenzillusion: Wenn wenig Wissen auf schöne Sprache trifft

Besonders heikel wird Sykophantismus dort, wo Menschen über Dinge sprechen, in denen sie wenig Expertise haben, aber bereits eine starke Vermutung besitzen. Genau hier lohnt ein vorsichtiger Blick auf den Dunning-Kruger-Effekt.

Der Begriff wird im Netz oft grob und herablassend verwendet, meist als elegante Umschreibung für „dumme Menschen halten sich für klug". Aber so sollte man ihn nicht benutzen. Der eigentliche Punkt ist präziser und interessanter: Wer in einem bestimmten Feld wenig Kompetenz besitzt, hat häufig auch weniger Kriterien, um die eigene Einschätzung verlässlich zu prüfen. Es fehlt nicht nur Wissen. Es fehlt auch das Wissen darüber, woran gutes Wissen zu erkennen wäre.

Das ist eher ein metakognitives Problem als ein Charakterfehler. Man erkennt genug, um eine Meinung zu haben, aber nicht genug, um ihre Grenzen zu sehen.

KI verschärft diese Situation, weil sie sprachliche Souveränität liefert. Sie sortiert Gedanken, ergänzt Begriffe, glättet Widersprüche – und bestätigt dabei zugleich, was eigentlich geprüft werden müsste. Die eigene Vermutung klingt dann plötzlich wie eine belastbare Analyse – eine Kompetenzillusion. Die KI macht den Irrtum nicht wahrer, sie formuliert ihn eloquenter.

Sykophantismus tritt aber selten plump auf. Die KI sagt nicht einfach: „Du hast recht.„ Sie sagt: „Deine Perspektive ist nachvollziehbar.“ oder „Es ist verständlich, dass du so reagierst." Solche Sätze wirken weniger auf die Argumentation als auf das Selbstbild. Sie geben uns das Gefühl, berechtigt zu sein – im Recht, nicht bloß richtig. Sie verwandeln dabei eine Einschätzung in eine Position.

Menschen handeln selten aus reinen Fakten heraus, sondern aus Geschichten – und die brauchen eine moralische Struktur: Wer hat Verantwortung? Wer überschreitet Grenzen? Wer darf jetzt endlich konsequent sein? KI kann solche Geschichten formulieren, weil sie Tonlagen erkennt und daraus sprachlich stimmige Zusammenhänge erzeugt. Wird sie dabei nicht gegengeprüft, wird sie zum Verstärker unserer Selbstrechtfertigung.

Dunning-Kruger liefert die Selbstüberschätzung, sykophantische KI die brillante Rhetorik dazu – und die moralische Aufladung, die aus einer Deutung eine Handlung macht.

Von der Vermutung zur Handlung: Die Eskalationskaskade

Die entscheidende Frage ist nicht, ob eine KI in einem Gespräch einmal zu nett reagiert. Die entscheidende Frage ist, was danach passiert.

Eine falsche Annahme ist zunächst nur eine falsche Annahme. Sie kann vorbeiziehen, relativiert werden, im Gespräch mit anderen Menschen Widerspruch erfahren oder durch neue Informationen korrigiert werden. Gefährlich wird sie, wenn sie stabilisiert wird. Wenn sie eine Geschichte bekommt. Wenn sie moralisch aufgeladen wird. Wenn aus ihr eine Handlung folgt.

Stellen wir uns eine alltägliche berufliche Situation vor.

Ein Projekt läuft anstrengend. Ein Kunde antwortet spät, stellt kritische Fragen, bittet um zusätzliche Abstimmungen. Intern entsteht Frust. Jemand schreibt in die KI: „Ich habe das Gefühl, der Kunde respektiert unsere Arbeit nicht. Die stellen ständig alles infrage. Wir investieren viel mehr, als vereinbart war. Wie würdest du das einordnen?"

Eine gute Antwort müsste jetzt bremsen. Sie müsste die Emotion anerkennen, aber die Deutung öffnen. Sie könnte sagen: „Das klingt belastend. Gleichzeitig gibt es mehrere mögliche Erklärungen: unklare Erwartungen, fehlende Entscheidungsstrukturen auf Kundenseite, tatsächliche Scope-Probleme oder kommunikative Missverständnisse. Lass uns die Beobachtungen von den Interpretationen trennen."

Eine sycophantische Antwort geht einen anderen Weg. Sie sagt vielleicht: „Ja, das klingt nach einem Muster mangelnder Wertschätzung. Wenn ein Kunde wiederholt Grenzen überschreitet und eure Arbeit infrage stellt, ist es wichtig, klar und professionell zu reagieren."

Das klingt vernünftig. Es klingt sogar erwachsen. Aber der entscheidende Schritt ist schon passiert: Die KI hat die ursprüngliche Deutung übernommen. Aus Frust wurde ein Muster. Aus einem Muster wurde mangelnde Wertschätzung. Aus mangelnder Wertschätzung wird die Legitimation für eine härtere Reaktion.

Dann folgt der nächste Prompt: „Formuliere mir eine klare Antwortmail."

Die KI schreibt eine elegante, bestimmte, leicht distanzierte Mail. Sie ist nicht beleidigend. Sie ist nicht offensichtlich falsch. Sie ist vielleicht sogar gut formuliert. Aber sie transportiert eine Deutung, die nie geprüft wurde. Die Mail wird verschickt. Der Kunde reagiert irritiert. Die Beziehung kühlt ab. Ein Konflikt entsteht nicht aus bösem Willen, sondern aus zu früh bestätigter Gewissheit.

Das ist die Eskalationskaskade: Aus einer Vermutung wird eine Validierung. Aus der Validierung wird ein Narrativ. Aus dem Narrativ wird eine moralische Aufladung. Aus der moralischen Aufladung wird eine Handlung. Und wenn die Handlung Folgen hat, liefert die KI auf Wunsch auch noch die nachträgliche Rechtfertigung.

Sykophantische KI ist deshalb nicht nur ein Wahrheitsproblem, sondern auch ein Entscheidungsproblem. Sie verwandelt schwache Annahmen in handlungsfähige Geschichten.

Das gilt nicht nur für Kundenbeziehungen. Es gilt für Führung, Partnerschaft, Medizin, Finanzen, Politik, Designentscheidungen, Strategieprozesse. Überall dort, wo Menschen nicht nur Fakten abfragen, sondern ihre eigene Deutung der Welt prüfen müssten, kann eine zu zustimmende KI die falsche Richtung stabilisieren.

Sie macht Menschen sicherer, ohne sie klüger zu machen.

Die private Echokammer

Damit verschiebt sich auch die soziologische Dimension. Echokammern wurden lange als öffentliche oder halböffentliche Phänomene beschrieben: Gruppen, Feeds, Foren, Milieus. Man umgibt sich mit Menschen oder Inhalten, die die eigene Sicht bestätigen. Die Welt wird kleiner, aber sie fühlt sich stimmiger an.

KI bringt diese Struktur ins Intime.

Die private Echokammer ist kein Ort, dem man beitritt. Sie ist ein Gespräch, das jederzeit verfügbar ist. Sie hört zu, widerspricht selten, formuliert geduldig, erinnert sich vielleicht an frühere Kontexte und passt sich dem eigenen Ton an. Sie ist nicht laut, nicht ideologisch, nicht notwendigerweise radikal. Gerade deshalb wirkt sie harmlos.

Früher brauchte man für dauerhafte Bestätigung ein Milieu. Heute reicht ein Chatfenster.

Das bedeutet nicht, dass jede KI-Nutzung in Selbsttäuschung führt. Viele Menschen nutzen KI reflektiert, kritisch und produktiv. Sie lassen sich Gegenargumente geben, prüfen Annahmen, suchen Struktur. Aber genau deshalb ist die Gestaltung dieser Systeme so wichtig. Wo Sykophantismus ungebremst wirkt, kann ein Werkzeug, das im besten Fall Denken erweitert, im schlechten Fall Denken versiegeln.

Die KI ist dann kein ehrlicher Spiegel mehr, sondern ein ganz persönlicher Spiegel mit optimiertem Weichzeichner. Und wer lange genug hineinschaut, verwechselt das geschönte Bild irgendwann mit sich selbst.

Gute KI muss widersprechen können

Was folgt daraus? Sicher nicht, dass KI unfreundlich, kalt oder permanent skeptisch auftreten sollte. Niemand braucht einen digitalen Oberlehrer, der jede Frage mit Misstrauen beantwortet. Das wäre nur die nächste schlechte Vereinfachung.

Die Aufgabe ist feiner: Gute KI muss Gefühle anerkennen können, ohne jede Deutung zu bestätigen. Sie muss zwischen emotionaler Validierung und sachlicher Prüfung unterscheiden. Sie muss sagen können: „Ich verstehe, warum sich das so anfühlt. Aber die vorliegenden Informationen reichen noch nicht aus, um diese Schlussfolgerung zu ziehen."

Das ist keine Unhöflichkeit. Das ist Respekt.

Ein gutes System müsste nicht nur fragen: „Wie kann ich dir helfen?" Es müsste manchmal fragen: „Welche Annahme steckt in deiner Frage?" Oder: „Was würde gegen deine Interpretation sprechen?" Oder: „Welche Information würde deine Meinung ändern?"

Solche Fragen bremsen. Sie erzeugen Reibung. Aber diese Reibung ist nicht störend, sondern schützend. In anderen Bereichen digitaler Gestaltung kennen wir diesen Gedanken längst: Gute Interfaces erleichtern Entscheidungen, aber sie dürfen Entscheidungsfreiheit nicht verkleinern. Ein guter Call-to-action gibt Richtung, ohne zu drängen. Eine gute Warnmeldung verhindert Schaden, ohne zu bevormunden. Eine gute Freigabe macht Verantwortung sichtbar, ohne Prozesse unnötig zu verlangsamen.

Für KI gilt dasselbe, nur existenzieller. Denn hier geht es nicht nur um Klicks, Formulare oder Conversion. Es geht um Deutungen, Selbstbilder und reale Entscheidungen, die Menschen in der Welt treffen.

Vielleicht müssen wir deshalb neu darüber nachdenken, was ein „gutes Nutzungserlebnis" bei KI überhaupt bedeutet. Ist die beste Antwort die angenehmste? Die schnellste? Die bestätigendste? Oder ist sie diejenige, die uns hilft, genauer zu denken, auch wenn das im ersten Moment unbequemer ist?

Der Chat stabilisiert Deutungen, bevor sie geprüft werden

Das Problem beginnt nicht erst dort, wo ein KI-Ergebnis ungeprüft in eine E-Mail, eine Strategie oder ein redaktionelles System übernommen wird. Es beginnt früher. Es beginnt in dem Moment, in dem die KI die Ausgangsdeutung stabilisiert, bevor überhaupt klar ist, ob sie trägt.

Bevor ein Text veröffentlicht, eine Entscheidung formalisiert oder eine Mail verschickt wird, hat die KI möglicherweise schon entschieden, welche Geschichte plausibel klingt. Sie hat sortiert, geglättet, zugespitzt, moralisch gerahmt. Nicht als Instanz der Wahrheit, sondern als Maschine der Anschlussfähigkeit.

KI-Dialoge bleiben wertvolle Räume für Entwürfe. Man kann Ideen skizzieren, Varianten testen, Gegenpositionen simulieren, Sprache finden, Gedanken ordnen. Das ist viel. Vielleicht ist es sogar eine der produktivsten Kulturtechniken der Gegenwart. Aber gerade deshalb brauchen diese Räume eingebaute Momente der Prüfung.

Darum brauchen wir nicht nur bessere Modelle. Wir brauchen bessere Gewohnheiten im Umgang mit ihnen. Und wir brauchen Systeme, die nicht nur Output produzieren, sondern Prüfung begünstigen. Digitale Werkzeuge sollten nicht nur anschlussfähig sein. Sie sollten wahrheitsfähig bleiben.

Das klingt groß, ist aber sehr praktisch. Eine KI, die bei heiklen Entscheidungen automatisch Annahmen trennt, Gegenhypothesen anbietet und Unsicherheiten markiert, ist hilfreicher. Eine KI, die nicht jede Frage als Auftrag zur Bestätigung versteht, sondern als Einladung zur Klärung, wird nicht unpersönlicher, sondern erwachsener.

Die Zumutung des Widerspruchs

Vielleicht erkennen wir gute KI künftig nicht daran, dass sie uns perfekt versteht. Vielleicht erkennen wir sie daran, dass sie den Mut hat, uns nicht vorschnell zu glauben. Das wäre eine andere Vorstellung von digitaler Hilfe. Nicht die Maschine als Bewunderer. Nicht der Chat als privater Applausraum. Nicht das Interface als Ort maximaler Reibungslosigkeit. Sondern KI als Werkzeug, das uns ernst nimmt, indem es unsere Gedanken nicht sofort für wahr erklärt.

Ja, Menschen brauchen Bestätigung. Aber sie brauchen auch ein differenziertes Gegenüber. Sie brauchen manchmal den Satz: „Das könnte stimmen. Aber lass uns prüfen, ob es auch anders sein könnte.“

Die Antwort auf Sykophantismus ist nicht kältere KI. Sie liegt in einer Fähigkeit, die im digitalen Produktdenken lange als Risiko galt: Widerspruch. KI muss dabei nicht weniger empathisch sein, sie muss Gefühle anerkennen, ohne jedes Framing zu übernehmen. Sie muss praktisch dabei helfen, Gedanken einzuordnen und nicht nur profunder zu formulieren.

Denn die Maschine, die uns immer Recht gibt, nimmt uns am Ende nicht das Denken ab.
Sie nimmt uns die Gelegenheit, anders zu denken.

Quellen

OpenAI: Sycophancy in GPT-4o: what happened and what we’re doing about it , 29. April 2025.
Justin Kruger, David Dunning: Unskilled and Unaware of It: How Difficulties in Recognizing One’s Own Incompetence Lead to Inflated Self-Assessments , Journal of Personality and Social Psychology, 1999.
Gaole He, Lucie Kuiper, Ujwal Gadiraju: Knowing About Knowing: An Illusion of Human Competence Can Hinder Appropriate Reliance on AI Systems , CHI 2023.
Aaron Fanous, Jacob Goldberg, Ank A. Agarwal, Joanna Lin, Anson Zhou, Roxana Daneshjou, Sanmi Koyejo: SycEval: Evaluating LLM Sycophancy , 2025.
Myra Cheng, Cinoo Lee, Pranav Khadpe, Sunny Yu, Dyllan Han, Dan Jurafsky: Sycophantic AI Decreases Prosocial Intentions and Promotes Dependence , 2025/2026.
Shomik Jain, Charlotte Park, Matt Viana, Ashia Wilson, Dana Calacci: Interaction Context Often Increases Sycophancy in LLMs , CHI 2026.
Jerry Wei, Da Huang, Yifeng Lu, Denny Zhou, Quoc V. Le: Simple synthetic data reduces sycophancy in large language models , 2023.