Die Verkörperung der künstlichen Intelligenz Wie die KI unser tägliches Leben neugestaltet: Die Robotik, grundlegend neue Betriebssysteme und die «Next to Normal»-These
Prof. Dr. Yoshija Walter
Wenn man früher von künstlicher Intelligenz (KI) sprach, hatte dies für die meisten Leute nichts mit dem echten Leben zu tun. Diese Situation hat sich drastisch verändert. Heutzutage ist KI nicht mehr nur ein abstraktes Konzept aus Science-Fiction-Romanen, sondern eine handfeste Realität, die immer mehr an Bedeutung gewinnt. Die "Verkörperung der künstlichen Intelligenz" – ein Phänomen, das einmal Sensation war und nun zur Normalität wird – bringt interessante anfassbare Neuerungen und ebenfalls tiefgreifende psychosoziale Implikationen mit sich, die es wert sind, betrachtet zu werden.
Die Verkörperung der KI
Wer von KI spricht, denkt oft an ChatGPT. Dieses System basiert auf der vierten Version der «Generative Pretrained Transformer» von OpenAI. Es gibt allerdings noch weitere vergleichbare Modelle, wie Gemini, Llama 2 (soeben wurde die dritte Version vorgestellt), Claude-3, Mixtral, und viele mehr. In diesen Beispielen befindet sich die KI ausschliesslich in der digitalen Welt und erledigt digitale Operationen. Besonders interessant und von hoher Relevanz für unseren Alltag ist, dass sie nach und nach verkörpert wird. Oder in anderen Worten: Die KI erhält einen Körper – und zwar in der Form von Robotern. Dies wird durch sog. «Language Action Models» (Sprach-Aktions-Modelle) ermöglicht, die Sprache wie auch Handlungsmodalitäten miteinander verbinden. Diese Modelle kommen sowohl in der Robotik, wie auch in autonomen KI-Agenten (digitalen Bots), zur Anwendung.
Language Action Models in der Robotik kombinieren natürliche Sprachverarbeitung (NLP) mit physischen Aktionsausführungen. Der Roboter verwendet hierbei Algorithmen, um gesprochene oder geschriebene Anweisungen zu interpretieren und in physische Aktionen umzusetzen. Dies ermöglicht es Robotern, Aufgaben wie das Öffnen von Türen, das Aufheben von Gegenständen oder das Ausführen komplexerer Aufgaben basierend auf verbalen Befehlen durchzuführen. Ein typisches Beispiel ist ein Roboter, der Anweisungen zum Zusammenbauen eines Möbelstücks aus verbalen Befehlen empfängt und diese dann umsetzt. Die Herausforderung besteht darin, die oft vage und mehrdeutige menschliche Sprache in eine präzise Sequenz von Roboterbewegungen zu übersetzen. Hier herrscht im Moment noch ein hohes Fehlerpotential.
In ähnlicher Weise verwenden autonome KI-Agenten, oft als Chatbots oder virtuelle Assistenten bezeichnet, Language Action Models, um Anfragen in Aktionen umzusetzen. Diese Aktionen sind zwar meistens softwarebasiert, beinhalten jedoch die Interaktion mit Datenbanken, das Auslösen von Prozessen oder das Senden von Informationen an andere Systeme. Ein virtueller Assistent in einem Kundensupport-System könnte beispielsweise die sprachliche Anfrage einer Kundin oder eines Kunden verstehen und entsprechend einen Rückerstattungsprozess einleiten oder weitere Informationen bereitstellen. Hier geht es vor allem darum, die Intention hinter der Benutzeranfrage zu erkennen und eine adäquate Aktion im digitalen Ökosystem auszulösen.
KI in der Robotik
Eines der faszinierendsten Beispiele für KI in der Robotik ist der Atlas von Boston Dynamics. Dieser humanoide Roboter, bekannt für seine beeindruckende Beweglichkeit und dynamische Manipulationsfähigkeiten, wird für eine Vielzahl von Anwendungen eingesetzt, von Rettungsaktionen bis hin zur Unterstützung bei schweren Bauarbeiten. Nicht weniger beeindruckend ist der Optimus von Tesla, ein Roboter, der entwickelt wurde, um repetitive und physisch anspruchsvolle Aufgaben zu automatisieren. Ein weiteres bemerkenswertes Beispiel ist RT-2, ein KI-System, das auf dem Transformer-Modell basiert und in der Robotik für komplexes Verhalten und Interaktionen genutzt wird. Diese Roboter stellen nicht nur die neuesten Entwicklungen in der KI und Robotik dar, sondern illustrieren auch das breite Spektrum an Möglichkeiten, wie KI die Interaktion mit der physischen Welt revolutionieren kann.
Moderne Roboter werden in simulierten Umgebungen trainiert, um soziale Aufgaben wie das Aufräumen eines Raumes oder das Navigieren in belebten Umgebungen gemeinsam mit Menschen zu erlernen. Sie sind darauf trainiert, sicher Abstand zu halten und effizient Aufgaben aufzuteilen, um die Zusammenarbeit mit Menschen zu optimieren. Roboter, die mit Foundation-Modellen arbeiten, lernen aus ihren Fehlern und passen ihre Planung kontinuierlich an, indem sie zusätzliches Wissen aus verschiedenen Quellen nutzen. Solche Systeme verwenden Echtzeit-Feedback und Anweisungen von Menschen, um ihre Leistung zu verbessern und genauere Aufgabenbewältigungen zu erzielen.
KI-Betriebssysteme und neue Tools
Der Einsatz von KI erstreckt sich auch auf Betriebssysteme und alltägliche Tools. Der KI-Pin, ein tragbares Gerät, ermöglicht es Benutzerinnenn und Benutzern, über Spracheingabe oder eine projizierte Laser-Ink-Anzeige auf der Handfläche zu interagieren, was eine innovative Art der Kommunikation darstellt. Der Rabbit R1, entwickelt von Rabbit in Zusammenarbeit mit Teenage Engineering, ist ein weiteres herausragendes Beispiel. Dieses Gerät vereinfacht durch seine intuitive Nutzung die Interaktionen der Nutzer:innen. Mit einem kleinen Touchscreen, einer rotierenden Kamera und einem analogen Scrollrad ausgestattet, nutzt der Rabbit R1 das Large Action Model (LAM) von Rabbit OS, um komplexe menschliche Intentionen zu verstehen und in Aktionen umzusetzen. Des Weiteren kommen immer mehr KI-Geräte mit eigenen künstlich neuronalen Betriebssystemen auf den Markt, wie beispielsweise:
- Google Nest Hub (2. Generation): Während es sich primär um ein Smart-Home-Gerät handelt, integriert Google Nest Hub fortschrittliche KI-Technologien für die Heimautomation und persönliche Assistenz.
- Amazon Echo Show 10: Dieses Gerät kombiniert eine intelligente Anzeige mit einem Lautsprechersystem und ist Alexa-fähig. Es beherrscht Dinge wie das Steuern von Smart-Home-Geräten, das Abspielen von Medien und das Unterstützen bei alltäglichen Anfragen, verfügt jedoch über ein grösseres Display und ist stärker in das Amazon-Ökosystem integriert.
- Ray-Ban Meta Smart Glasses: Diese smarten Brillen integrieren Augmented Reality und KI-Funktionen, die es Benutzerinnen und Benutzern ermöglichen, Informationen direkt vor ihren Augen anzuzeigen und über Sprachbefehle zu interagieren. Sie bieten eine tragbare «hands-free» Alternative zum Handy und dem Computer.
- Bose Frames (Audio-Sonnenbrillen): Auch wenn diese hauptsächlich für Audio ausgelegt sind, integrieren sie begrenzte KI-gestützte Funktionen über die Sprachsteuerung, wodurch Nutzer:innen Musik hören, Anrufe tätigen oder Informationen wie Navigation ohne Blick auf ein Gerät erhalten können.
KI-Avatare auf den sozialen Medien
In den sozialen Medien haben KI-Modelle und -Influencer wie Lil Miquela oder Shudu, die Produkte bewerben und Inhalte erstellen, eine neue Ära des digitalen Marketings eingeleitet. Diese virtuellen Persönlichkeiten interagieren mit echten Nutzerinnen und Nutzern und zeigen die wachsende Akzeptanz und den Einfluss von KI in diesem Bereich. Damit erreicht man die vollständige persönliche Automatisierung der Interaktion mit den Kunden. Auch im E-Commerce werden KI-basierte Shopping-Assistenten eingesetzt, um das Online-Shoppingerlebnis zu personalisieren und zu verbessern. Sie bieten Empfehlungen basierend auf den Präferenzen der Nutzer:innen und unterstützen den gesamten Kaufprozess. Kürzlich hat Microsoft ihr neues Modell Vasa-1 publiziert, welches ermöglicht, in Echtzeit Bilder von Gesichtern anhand von Audiotexten zu animieren. Dies wird die Interaktion mit KI-Avataren nochmals sehr viel natürlicher machen.
Mittels neuer Technologien wie Virtual und Augmented Reality, z.B. dank Quest-3 von Meta oder Apple Vision Pro, und dem langsamen Voranschreiten des Metaversums, können KI-Avatare in naher Zukunft auch bald lebensnah und beinahe greifbar vollkommen automatisiert mit den Menschen interagieren. Bei dieser stets steigenden Verkörperung der künstlichen Intelligenz stellt sich die Frage, ob menschliche Interaktionen künftig überhaupt noch gebraucht oder erwünscht sein werden.
Die Psychologie der KI-Normalisierung
Was früher noch Science Fiction der KI war, wird unserem Gefühl entsprechend zunehmend normal. Die Angst vor der neuen Technologie war besonders Ende 2022 und Anfangs 2023 spürbar, wo Zeitungen und Experten mit Nachrichten dieser «gefährlichen KI» konstant Alarm schlugen. Dieser ängstliche Alarmismus scheint langsam abzuebben und die Menschen gewöhnen sich schleichend an GPT und Co. Die fortschreitende Integration und Normalisierung von KI führen zu einer Veränderung in der Wahrnehmung dieser Technologien. Diese psychologische Dynamik wurde unter dem Begriff der «Next to Normal»-These diskutiert (Walter, 2024a). Die These beschreibt, wie ähnlich dem Aufkommen der digitalen Computer, nun auch die KI sukzessive den Weg in unseren Alltag findet. Sie zeichnet dabei zwei einander entgegengesetzte Psychologieeffekte auf:
- Der «Mere Exposure Effect:» Dieser empirisch belegte Effekt suggeriert, dass wiederholte Exposition gegenüber KI zu einer positiveren Wahrnehmung führt. Dies könnte dazu führen, dass echte Sicherheitsbedenken unterbewertet werden.
- Der «Black Box Effect»: Dieser beschreibt die anhaltende Unsicherheit und das Unbehagen, die aus einem mangelnden Verständnis der KI-Funktionsweise resultieren. Selbst KI-Expertinnen und -Experten, die mit diesen Technologien arbeiten, könnten diesem Effekt unterliegen.
Letztlich wird bei wiederholter Exposition der erste Effekt gegenüber dem zweiten Effekt dominanter, sodass die Alarmbereitschaft stetig sinkt und sich eine gleichgültige Normalität mit unserem neuen verkörperten Freund – der KI – einstellt. Dies könnte vor allem dann zum Problem werden, wenn sich die KI verselbstständigt und wir uns aber bereits zu stark an sie gewöhnt haben. Der bekannte Technikphilosoph Nik Bostrom geht in seinem Buch «Deep Utopia» sogar noch einen Schritt weiter und träumt nicht nur von einer Zukunft, wo wir uns an die KI gewöhnt haben, sondern von einer, wo sie all unsere menschlichen Limitierungen überwindet.
Bewertung
Während KI immer mehr zu einem integralen Bestandteil unseres Lebens wird, ist es von entscheidender Bedeutung, dass Forschung und Regulierung mit dieser Entwicklung Schritt halten, um sicherzustellen, dass die Eingliederung von KI ethisch vertretbar und sicher bleibt. Die Debatte über KI und ihre Implikationen ist weit davon entfernt, abgeschlossen zu sein, und es bleibt abzuwarten, wie sich unsere Gesellschaft an diese neue "normale" Technologie anpassen wird. Die Verkörperung der künstlichen Intelligenz ist mehr als nur ein technologischer Fortschritt; sie ist ein kultureller und psychologischer Wandel, der tief in unsere täglichen Interaktionen und unser Verständnis von Technologie eingewoben wird. Wie wir diese Herausforderungen angehen und die Chancen nutzen, die sich aus dieser Entwicklung ergeben, wird nicht nur die Zukunft der KI, sondern auch die zukünftige Form unserer Gesellschaft prägen. Insofern ist es wichtig, dass wir darauf Acht geben, die KI im besten Sinne der Menschen als «Human-Centered AI» zu erschaffen (Walter, 2024b).
Quellen und weiterführende Informationen
Walter, Y. (2024a). The Future of Artificial Intelligence will be “Next to Normal” – A perspective on Future Directions and the Psychology of AI Safety Concerns. Nature Anthropology, 2(1), 1-9.
Walter, Y. (2024b). A Framework for Human-Centered AI: Bridging the Economics of the Digital Divide and Solving the Problem of Demographic Implosion. Nature Anthropology, 2(2), 1-3.
Diese Seite teilen
CAS FH in KI-Management (Künstliche Intelligenz / Artificial Intelligence)
Certificate of Advanced Studies (CAS)