Ein Blick in die Zukunft: KI Agenten-Netzwerke
Einige von Ihnen werden sich vielleicht noch an "Clippy" erinnern oder im deutschen "Karl Klammer". Ein interaktiver Assistent, der zwischen 1997 und 2003 in Microsoft Office integriert war. Es handelte sich um einen ersten Versuch von Microsoft, den Nutzern einen "intelligenten" digitalen Assistenten zur Verfügung zu stellen. Clippy konnte erkennen, welche Aufgabe der Benutzer gerade ausführte, und bot kontextabhängige Unterstützung an. Er schlug etwa beim Verfassen eines Briefes nützliche Formulierungen oder Vorlagen vor, gab Ratschläge zur effizienteren Nutzung von Office-Funktionen und ermöglichte schnellen Zugriff auf Hilfethemen. Abhängig von den Aktionen des Benutzers bot er maßgeschneiderte Tipps an, um häufige Fehler zu vermeiden oder Arbeitsprozesse zu optimieren. Doch er basierte auf einfachen vorgefertigten Skripten und bei den Nutzern kam er nicht gut an, wurde als wenig hilfreich und sogar lästig empfunden. 2003 musste Microsoft ihn wieder einmotten.
Erst 12 Jahre später, im Sommer 2015, wagten sie mit Cortana in Windows 10 einen zweiten Versuch. Cortana war sprachgesteuert und basierte erstmals auf noch simplen KI-Algorithmen. Sie konnte aktiv einfache Aufgaben umsetzen wie das Anlegen von Erinnerungen und Kalendereinträgen, das Senden von E-Mails oder die Suche im Web. Durch maschinelles Lernen konnte Cortana aus den Interaktionen mit Benutzern lernen und ihre Antworten sowie Empfehlungen im Laufe der Zeit verbessern. Sie passte sich den Präferenzen und Gewohnheiten des Benutzers an, um personalisierte Unterstützung zu bieten. Doch auch ihr Funktionsumfang war auf ganz bestimmte Aufgaben beschränkt und sie wurde wenig genutzt.
Es sollte weitere 7 Jahre dauern, bis sich unser Verhältnis zu digitalen Assistenten erstmals grundlegend veränderte. Im November 2022 erschien ChatGPT mit einem Paukenschlag auf der Bildfläche und läutete eine neue Ära ein: Erstmals waren digitale Assistenten wirklich nützlich und die Interaktion mit ihnen fühlte sich natürlich an. Innerhalb von nur 5 Tagen nutzten 1 Million Menschen die App, und nach zwei Monaten waren es bereits 100 Millionen monatlich aktive Nutzer. Das machte ChatGPT zur am schnellsten wachsenden Verbraucher-App in der Geschichte.
Es war eine Tür aufgestoßen worden, die weitere Innovation in atemberaubendem Tempo ermöglichte. Schnell wurde klar, dass man seinen Chatbot über verschiedene Wege auch spezialisieren konnte. Entweder über einen sogenannten "System-Prompt" in dem man einfach in natürlicher Sprache beschrieb, wie der Bot sich verhalten sollte oder via "Retrieval-Augmented Generation" (RAG), wo man dem Bot Zugriff auf externe Datenquellen wie Dokumente oder Datenbanken gewährt. Damit waren die "KI-Agenten" geboren: Chatbots, die auf bestimmte Rollen mit spezifischem Wissen spezialisiert sind.
Aktuell findet eine Entwicklung statt, die es diesen Agenten ermöglichen wird, nicht nur mit dem Nutzer zu interagieren und Output zu generieren, sondern auch aktiv Dinge umzusetzen und zu erledigen. Dazu sind vor allem Schnittstellen notwendig zu den Apps, die bedient werden sollen.
Bereits seit vielen Jahren gibt es Plattformen wie IFTTT, Zapier oder n8n, die es ermöglichen, verschiedene Applikationen miteinander zu verbinden und so ganze Arbeitsabläufe zu automatisieren. Man kann etwa einen automatischen Eintrag in einer Excel-Liste erstellen lassen, jedes Mal, wenn eine Mail mit einer Rechnung eintrifft, um eine Übersicht über die eigenen Ausgaben zu erhalten. Doch diese Abläufe sind starr und müssen manuell definiert werden. Die Umsetzung dieser Interaktionen zwischen den Apps erfolgt über sogenannte "API-Calls".
Auch die KI-Agenten werden bald lernen, über solche API-Calls direkt mit den verschiedenen Applikationen zu sprechen und dort Aktionen auszulösen und umzusetzen. Das kann das Aktualisieren einer Datenbank sein, das Versenden einer Mail oder das Protokollieren eines Projektfortschritts. Jede beliebige Aktion, die wir bisher in Applikationen manuell durchgeführt haben, wäre denkbar.
Zunächst werden diese Interaktionen auf unsere Anweisung hin geschehen, doch bereits bei der nächsten Generation der KI-Modelle, die wir im nächsten Jahr sehen werden, sind deutlich ausgeprägtere "Reasoning"-Fähigkeiten zu erwarten, die es den KI-Agenten erlauben planerisch vorzugehen und autonom zu handeln. Wir werden nur noch das Ergebnis vorgeben und der KI-Agent wird alles Notwendige ausführen, um dieses Ergebnis zu erreichen.
Der nächste logische Schritt ist dann nicht mehr weit entfernt: Spezialisierte, autonome Agenten, die miteinander interagieren und Aufgabenpakete delegieren. Genauso, wie in heutigen Unternehmen unterschiedliche Mitarbeiter für unterschiedliche Aufgaben zuständig sind und dennoch abgestimmt auf ein gemeinsames Ziel hinarbeiten.
Diese Agenten-Netzwerke werden in den nächsten Jahren Einzug halten in unseren Alltag und in viele Unternehmen, und wir sollten uns heute schon fragen, welche Implikationen das haben könnte. Was erlauben wir der KI autonom auszuführen? Wie werden die menschlichen Mitarbeiter eingebunden? Wie verändern sich Jobprofile und Fähigkeitsanforderungen? Wie genau sehen die neuen Organisationsstrukturen aus, die eine Zusammenarbeit von menschlichen und virtuellen Mitarbeitern ermöglichen?
Die Gestaltung dieser neuen Arbeitswelt erfordert ein hohes Maß an gesellschaftlichem Diskurs und Verantwortungsbewusstsein, damit wir sicherstellen, dass die Möglichkeiten der Agenten-Netzwerke sinnvoll genutzt werden und sie nicht als Ersatz, sondern als Verstärker des menschlichen Potenzials fungieren. Mit unserem Engagement bei Exponentielle Schule wollen wir dazu ebenfalls beitragen.