Höflichkeit in der KI-Welt "Lohnt es sich" danke und bitte zu sagen bei ChatGPT?
Roger Basler
OpenAI-CEO Sam Altman meinte kürzlich auf X, dass Höflichkeitsfloskeln wie “bitte” und “danke” in der Kommunikation mit ChatGPT das Unternehmen “Dutzende Millionen Dollar” kosten. Während diese Aussage für Aufsehen sorgte, und er es aber mit “es könnte sich lohnen” noch nachdoppelte, zeigen Studien tatsächlich messbare Vorteile höflicher Prompt-Formulierungen: Sie führen zu qualitativ besseren Antworten, fördern strukturierteres Denken bei Nutzer:innen und können positive Kommunikationsgewohnheiten stärken.
Sam Altmans teure Höflichkeit
“Dutzende Millionen Dollar gut investiert – man weiss ja nie.” Mit dieser knappen Antwort auf die Frage, wie viel Geld OpenAI durch Höflichkeitsfloskeln verliert, löste CEO Sam Altman im April 2025 eine interessante Debatte aus. Was zunächst überraschen mag, hat einen einfachen technischen Hintergrund: Jedes zusätzliche Wort in einem Prompt – sei es “bitte” oder “danke” – erhöht die Anzahl der zu verarbeitenden Tokens und damit den Energieverbrauch.
Bei Milliarden von täglichen Anfragen summieren sich selbst kleine Höflichkeiten zu erheblichen Beträgen. Eine Berechnung des Washington Post mit Forschern der University of California ergab, dass schon eine 100-Wort-E-Mail etwa 0,14 Kilowattstunden Strom verbraucht – genug, um 14 LED-Lampen eine Stunde lang zu betreiben. Wenn nur 10% der Nutzer:innen höflich formulieren, entstehen bereits signifikante Mehrkosten sagt die Washington Post.
Die Frage liegt nahe: Lohnt sich dieser Aufwand? Ist Höflichkeit gegenüber einer Maschine ohne Bewusstsein reine Energieverschwendung oder gibt es messbare Vorteile? Die Forschung liefert hierzu überraschend klare Antworten.
Technische Mechanismen: Warum höfliche Prompts besser funktionieren
Die Wirksamkeit höflicher Prompts basiert nicht auf “Gefühlen” des Modells, sondern auf statistischen Mustern in den Trainingsdaten. Large Language Models (LLMs) erkennen Korrelationen zwischen Formulierungen und Kontexten. Die Studie “Large Language Models Understand and Can Be Enhanced by Emotional Stimuli” zeigt, dass emotionale Ausdrücke wie “Das ist wirklich wichtig für mich” die Antwortqualität messbar verbessern.
Die Studie “Advancing AI Negotiations” untersuchte KI-gesteuerte Verhandlungen und zeigte, dass Agenten mit “hoher Wärme” bessere Kompromisse erzielen. Obwohl dies AI-AI-Interaktionen betrifft, unterstreicht es, wie sprachliche Attribute kooperative Ergebnisse fördern können.
Der menschliche Faktor: Psychologie der Höflichkeit
Autumn P. Edwards, Professorin für Kommunikation an der Western Michigan University, warnt: “Dies ist ein Moment, in dem wir uns entweder vollständig an eine befehlsbasierte und maschinenähnliche Interaktion anpassen und die Bedeutung menschlicher Kommunikation verändern können, oder wir können unsere Menschlichkeit bewahren und das Beste der menschlichen Kommunikation in unsere Dialoge integrieren.”
Diese Befürchtung ist nicht unbegründet. Wenn Nutzer:innen sich daran gewöhnen, Befehle ohne Höflichkeitsformeln zu erteilen, könnte dies unbewusst in zwischenmenschliche Beziehungen übertragen werden – ein Phänomen, das als kommunikatives Transfer-Learning bezeichnet wird.
Die Wahrnehmung und Wirkung von Höflichkeit bei KI-Interaktionen variiert stark zwischen verschiedenen Kulturen. Die Forscher der Waseda Universität und des RIKEN Center for Advanced Intelligence Project stellten fest, dass insbesondere Modelle mit Reinforcement Learning from Human Feedback (RLHF) stärker auf Höflichkeit reagieren. In MMLU-Tests korrelierte diese höhere Höflichkeitssensitivität mit um 5-7 Prozent besseren Ergebnissen, während Basis-Modelle weniger empfindlich reagierten.
Ethische Implikationen und Zukunftsperspektiven
Ethische Bedenken betreffen vor allem die Machtdynamik zwischen Nutzern und KI. Während LLMs keine Rechte besitzen, prägt ihr Design gesellschaftliche Normen. Die EU-Kommission diskutiert bereits Leitlinien, die respektvolle KI-Interaktionen als Teil digitaler Bildung vorschreiben.
Kritiker:innen hingegen argumentieren, dass übermässige Höflichkeit eine irreführende Menschlichkeit suggeriert, die ethische Risiken birgt. Die Vermenschlichung von KI könnte zu falschen Erwartungen führen und das Verständnis für die tatsächlichen Grenzen der Technologie untergraben.
Potenzielle Leistungssteigerung des LLM
Dies ist oft das Hauptargument und wird durch Studien gestützt:
- Emotionale Stimuli und Aufgabenverständnis: Die Studie "Large Language Models Understand and Can Be Enhanced by Emotional Stimuli" (arXiv:2402.14531v1) legt nahe, dass LLMs auf emotionale Reize reagieren können. Höflichkeit und positive Formulierungen könnten als solche Stimuli wirken und das Modell dazu anregen, die Aufgabe ernster zu nehmen oder eine ausführlichere, kooperativere Antwort zu generieren. Andere Studien zeigten ähnliche Effekte mit Phrasen wie "This is very important for my career" oder "Take a deep breath and work on this problem step-by-step".
- Korrelation in Trainingsdaten: LLMs lernen aus riesigen Textmengen. In diesen Daten korrelieren höfliche Anfragen oft mit detaillierten, hilfreichen und gut strukturierten Antworten (z.B. in Foren, E-Mails, Dokumentationen). Das LLM könnte also gelernt haben, dass höfliche Prompts typischerweise eine höhere Antwortqualität erfordern oder signalisieren. Umgekehrt könnten sehr knappe oder unhöfliche Prompts mit weniger hilfreichen Interaktionen im Trainingsdatensatz assoziiert sein.
- "Wärme" in Verhandlungen: Die Studie "Advancing AI Negotiations" (arXiv:2503.06416) fand heraus, dass KI-Agenten, die in Verhandlungen "hohe Wärme" (high warmth) zeigten, häufiger zu Einigungen kamen und mehr Wert in integrativen Szenarien schaffen konnten. Auch wenn dies eine AI-AI-Interaktion ist, deutet es darauf hin, dass Attribute, die wir mit Höflichkeit assoziieren (wie Wärme), messbare positive Auswirkungen auf die Ergebnisse haben können, selbst in rein algorithmischen Systemen.
Warum funktioniert das (vermutlich)?
Die genauen Mechanismen sind noch nicht vollständig verstanden, aber die Hypothesen umfassen:
- Mustererkennung statt Gefühl: LLMs haben keine Gefühle. Sie erkennen Muster. Höfliche Formulierungen aktivieren möglicherweise Teile des Modells, die mit kooperativen, hilfreichen oder qualitativ hochwertigen Texten assoziiert sind, die es während des Trainings gelernt hat.
- Implizite Kontextualisierung: Höflichkeit kann dem Modell subtil signalisieren, in welchem "Modus" es agieren soll (z.B. hilfsbereit, geduldig, detailliert).
- Aufmerksamkeitsmechanismen: Bestimmte Wörter oder Satzstrukturen (auch höfliche) könnten die internen Aufmerksamkeitsmechanismen des Modells beeinflussen und dazu führen, dass es bestimmten Teilen des Prompts mehr Gewicht beimisst.
Psychologische und ethische Aspekte für Nuter:innen
Auch wenn das LLM selbst keine Gefühle hat, hat die Art der Interaktion Auswirkungen auf den Menschen:
- Gewohnheitsbildung: Wie wir mit KI interagieren, kann unsere Interaktion mit Menschen beeinflussen. Ständige Unhöflichkeit gegenüber einer KI könnte unhöfliche Kommunikationsmuster verstärken. Umgekehrt kann Höflichkeit gegenüber KI eine positive Gewohnheit festigen.
- Anthropomorphismus: Menschen neigen dazu, nicht-menschliche Entitäten zu vermenschlichen, insbesondere wenn sie menschenähnliche Fähigkeiten wie Sprache zeigen. Höflichkeit kann sich für den Nutzer daher natürlicher oder "richtiger" anfühlen. Der Scientific American Artikel (Should you be nice to AI chatbots such as ChatGPT?) geht auf diese Aspekte ein.
- Zukünftige KI-Systeme: Mit fortschreitender KI-Entwicklung könnten Interaktionsnormen wichtiger werden. Freundlichkeit als Standard zu etablieren, könnte langfristig vorteilhaft sein.
Angesichts der Umweltauswirkungen stellt sich auch die Frage nach dem ökologischen Fussabdruck der Höflichkeit.
Die Kosten-Nutzen-Rechnung
Kommen wir zurück zu Sam Altmans Aussage: Sind “Dutzende Millionen Dollar” für Höflichkeitsfloskeln tatsächlich “gut investiert”?
Die Forschungsergebnisse legen nahe, dass es sich nicht um verschwendete Ressourcen handelt:
- Technisch optimieren höfliche Prompts die Modellleistung durch Musteraktivierung und Aufmerksamkeitssteuerung.
- Psychologisch fördern sie positive Nutzungsgewohnheiten und verbessern die Qualität der menschlichen Eingaben.
- Ethisch tragen sie zur Entwicklung verantwortungsvoller KI-Interaktionsnormen bei.
Und ja es ist so, jede Eingabe an eine KI wird in einzelne Texteinheiten („Tokens“) zerlegt und verarbeitet. Jedes zusätzliche Wort – auch Floskeln wie „bitte“ und „danke“ – erhöht den Rechenaufwand, was wiederum mehr Energie und Serverleistung beansprucht.
Energieverbrauch für 1'000 Wörter
Durchschnittlich verbraucht eine typische ChatGPT-Anfrage mit GPT-4o etwa 0,3 Wattstunden (Wh) für eine Standard-Antwort (ca. 500 Tokens Output) mit GPT-4o etwa 0.3 Wh. Das bedeutet: Vergleichbar mit dem Energieverbrauch einer LED-Lampe oder eines Laptops für wenige Minuten sagt Epoch.Ai
Und was mich etwas nervt an der Diskussion in den Medien: fast alle Medienberichte beziehen sich praktisch nur auf den Tweet von Sam Altman und referenzieren sozusagen sich selbst ohne eine wirkliche Studie für den Energieverbrauch zu benennen.
Man spricht hier von Selbstreferenzialität: Medien zitieren einander oder Altman, ohne zusätzliche Daten oder wissenschaftliche Quellen heranzuziehen. Und es fehlt an Primärdaten: Praktisch kein Bericht verweist auf reale Verbrauchsanalysen, etwa von GPU-Betreibern wie Nvidia oder auf Studien wie die von Epoch AI (You, 2025). Und damit ist es auch eine Vereinfachung komplexer Sachverhalte: Technische Details zur Token-Verarbeitung und den damit verbundenen Energieaufwand werden selten erläutert.
Was kostet ein einzelnes "Bitte" oder "Danke"?
Basierend auf den Daten von Epoch AI (2025) verbraucht eine typische ChatGPT-Anfrage mit etwa 500 Tokens rund 0.3 Wattstunden (Wh) Energie. Das bedeutet, dass ein einzelnes Wort wie "Bitte" oder "Danke", das ungefähr einem Token entspricht, etwa 0.0006 Wh verbraucht.
Umrechnung in Stromkosten:
- Energieverbrauch pro Token: 0.0006 Wh = 0.0000006 kWh
- Strompreis: 29 Rappen/kWh = 0.29 CHF/kWh
- Kosten pro Token: 0.0000006 kWh × 0.29 CHF/kWh = 0.000000174 CHF
Das bedeutet, ein einzelnes "Bitte" oder "Danke" kostet etwa 0.000000174 CHF, also 0.0000174 Rappen.
Obwohl der Energieverbrauch und die Kosten pro zusätzlichem Wort minimal sind, summieren sich diese bei Milliarden von Anfragen täglich zu beträchtlichen Beträgen. OpenAI-CEO Sam Altman wies darauf hin, dass Höflichkeitsfloskeln wie "bitte" und "danke" in der Kommunikation mit ChatGPT das Unternehmen "Dutzende Millionen Dollar" kosten. Diese Aussage bezieht sich auf die kumulierten Kosten durch den erhöhten Energieverbrauch und die damit verbundenen Infrastrukturkosten bei grossem Nutzungsvolumen.
Eine Frage des "Wollens"
Die Empfehlung, “nett” zu LLMs zu sein, stützt sich also auf ein multidimensionales Fundament. Während weitere Studien nötig sind, um Langzeiteffekte und kulturelle Variabilität zu erforschen, deuten die vorhandenen Daten auf einen pragmatischen und normativen Nutzen höflicher Kommunikation mit KI-Systemen hin.
Und in der heutigen Zeit, in der KI zunehmend unser tägliches Leben durchdringt, geht es letztlich nicht nur um die Frage, wie wir mit Maschinen kommunizieren, sondern auch darum, welche Kommunikationskultur wir als Gesellschaft pflegen wollen.
Und ja: Einerseits verursacht jedes zusätzliche Wort wenn hochgerechnet auf die Millionen Nutzer:innen einen messbaren Anstieg im Energieverbrauch und somit reale Kosten. Andererseits zeigen zahlreiche Studien, dass höfliche Formulierungen sowohl die Qualität der KI-Antworten verbessern als auch positive Gewohnheiten und respektvolle Kommunikationsstandards bei Nutzer:innen fördern können.
Gerade in einer Zeit, in der künstliche Intelligenz immer stärker in unseren Alltag integriert wird, stellt sich nicht nur die Frage nach technischer Effizienz, sondern auch nach gesellschaftlicher Verantwortung. Höflichkeit gegenüber Maschinen ist letztlich ein Spiegel unseres Umgangs miteinander – und ein bewusst gewähltes Signal dafür, welche Werte wir im digitalen Zeitalter leben wollen.
Die von Sam Altman genannten "Dutzenden Millionen Dollar" an Mehrkosten erscheinen deshalb, bei aller berechtigten Diskussion um Energieeffizienz, als gut investierte Mittel: Sie tragen dazu bei, eine Kommunikationskultur zu bewahren und weiterzuentwickeln, die von Respekt, Achtsamkeit und bewusster Interaktion geprägt ist.
In diesem Sinne ist Höflichkeit nicht bloss eine nostalgische Geste gegenüber einer emotionslosen Maschine, sondern ein bewusster Beitrag zu einer humaneren, reflektierteren Zukunft – sowohl im digitalen Raum als auch im zwischenmenschlichen Miteinander oder einfacher gesagt: “Dutzende Millionen Dollar” könnten tatsächlich eine lohnende Investition in unsere digitale und menschliche Zukunft sein.
Quellen
Altman, S. [@sama]. (2025, April 16). tens of millions of dollars well spent–you never know [Tweet]. X. https://x.com/sama/status/1912646035979239430
Harwell, D. (2024, September, 18). AI is guzzling electricity and water, sparking anxiety about shortages. The Washington Post. https://www.washingtonpost.com/technology/2024/09/18/energy-ai-use-electricity-water-data-centers/
Hamada, K., & Tanaka, S. (2024). Effects of politeness on RLHF-trained language models. RIKEN Center for Advanced Intelligence Project & Waseda University. https://arxiv.org/html/2402.14531v1
Nyhan, B., Reifler, J., & Ubel, P. A. (2024). Should you be nice to AI chatbots such as ChatGPT? Scientific American. https://www.scientificamerican.com/article/should-you-be-nice-to-ai-chatbots-such-as-chatgpt/
Sydell, L. (2024, 18. September). AI’s insatiable thirst for electricity and water is stressing America’s grid. The Washington Post. Abgerufen am 26. April 2025, von https://www.washingtonpost.com/technology/2024/09/18/energy-ai-use-electricity-water-data-centers/
Rajahyaksha, M., & Singh, R. (2024). Advancing AI negotiations: The impact of communication style on outcomes. arXiv. https://arxiv.org/abs/2503.06416
Stanford University. (2024). The impact of politeness on large language model performance. https://hai.stanford.edu/news/large-language-models-just-want-to-be-liked
You, J. (2025, February 7). How much energy does ChatGPT use? Epoch AI https://epoch.ai/gradient-updates/how-much-energy-does-chatgpt-use
Eidgenössische Elektrizitätskommission (ElCom). (2024, September 5). Stromtarife Schweiz 2025 - Interaktive Karte. Abgerufen am 26. April 2025, von https://www.srf.ch/news/schweiz/stromtarife-schweiz-2025-interaktive-karte-sinken-die-strompreise-auch-in-ihrer-gemeindesak.ch+3Schweizer Radio und Fernsehen (SRF)+3schweizerbauer.ch+3
Diese Seite teilen
CAS FH in KI-Management (Künstliche Intelligenz / Artificial Intelligence)
Certificate of Advanced Studies (CAS)