Der Wettstreit um einen gigantischen Zukunftsmarkt ist in diesem Sommer in die heiße Phase eingetreten: Auf seiner firmeneigenen Entwicklerkonferenz kündigte Apple Mitte Juni an, seinen sprachgesteuerten Assistenten „Siri“ erstmals für andere Anbieter zu öffnen. Siri soll so zu einer umfassenden Software-Plattform für unterschiedlichste digitale Dienstleistungen werden.
Amazon, Google und Facebook haben ebenfalls ähnliche Systeme angekündigt oder bereits im Angebot. Die jeweiligen Assistenten verfolgen dasselbe Ziel: Unter Zuhilfenahme „künstlicher Intelligenz“ sollen sie uns bei den alltäglichsten Erledigungen unterstützen – Termine planen, Licht regeln oder Taxis bestellen.
Die Verrichtung solcher Aufgaben erscheint auf den ersten Blick banal. Tatsächlich aber dürften die sprachgesteuerten Diener eine neue digitale Ära einläuten: In den 1990er Jahren revolutionierte das World Wide Web unsere Kommunikation und unser Medienverhalten; eine Dekade später gelang dies Smartphones und Apps. In den kommenden Jahre soll nun die sprachgesteuerte Computernutzung die Apps ablösen – und uns gleichzeitig die Tür zu einer neuen, digitalen Dienstleistungswelt aufstoßen.
Allerdings hat diese Vision zwei gewaltige Haken: Denn zum einen versorgen uns die Assistenten nur mit ausgewählten Diensten. Die Konzerne legen fest, welche Tür sich ihren Kunden öffnet – und welche nicht. Sie werden damit endgültig zu den Einlassern – Gatekeepern – die das Internet einst eigentlich überflüssig machen sollte. Zum anderen müssen die digitalen Diener, um ihre Aufgaben zu erfüllen, uns nicht nur in- und auswendig kennen, sondern auch unentwegt belauschen – und zwar im öffentlichen wie im privaten Raum gleichermaßen.
»Earl Grey, hot!«
Bislang sind uns kommunizierende Computer vor allem aus Science-Fiction-Filmen vertraut, sei es das Weltraumepos „Star Trek“, Stanley Kubricks „Odyssee 2001“ oder Douglas Adams’ Zukunftssatire „Per Anhalter durch die Galaxis“. Folgsam führen die Rechner dort menschliche Befehle aus: Sie bereiten einen Earl-Grey-Tee zu, ermitteln den Aufenthaltsort eines Crew-Mitglieds oder finden die endgültige Antwort auf die letzte aller Fragen („42“).
Die Faszination für die dialogbasierte Technik speist sich dabei aus zweierlei. Erstens kann der Computer durch sie sprachliche Äußerungen verstehen, wie wir sie auch im Alltag verwenden. Selbst Kleinkinder können ihn daher benutzen. Zweitens braucht es nur eines knappen Befehls, um den Rechner zu komplexen Handlungen zu veranlassen.
Die gewaltigen technischen Entwicklungen der vergangenen Jahre lassen diesen Zukunftstraum nun Wirklichkeit werden. So ist die Hardware immer leistungsfähiger geworden: Aktuelle Smartphone-Modelle verfügen mitunter über eine ähnliche Rechenkraft wie hochpreisige Laptops. Darüber hinaus setzen die Internetkonzerne auf sogenannte Clouddienste: Die Nutzerdaten speichern sie nicht länger auf den Endgeräten, sondern auf den firmeneigenen Servern – wo sie ausgiebig analysiert und weiterverarbeitet werden. Und auch im Softwarebereich wurden enorme Fortschritte erzielt – nicht zuletzt auf dem Feld der Spracherkennung. Selbst seitenlange Diktate übertragen Computer inzwischen weitgehend fehlerfrei in Schriftsprache.
All dies bildet auch die Grundlage für die entscheidende Entwicklung: die der sogenannten künstlichen Intelligenz – Computerprogramme, die selbstständig Anwendungsprobleme lösen und dabei ihre eigenen Fähigkeiten ständig erweitern. Indem die lernfähige Software zudem noch gesammelte Nutzungsdaten auswertet, soll sie sich weitgehend autonom an unterschiedliche Kontexte und Bedingungen anpassen können.
Bot hört mit
Wie weit dieser Ansatz bereits gediehen ist, zeigen die Pläne, die Facebook Mitte April vorstellte – ebenfalls auf seiner Entwicklerkonferenz „F8“.
So will der Konzern unter anderem seine Messenger-App, die weltweit über 900 Millionen Menschen nutzen, mit Bots ausstatten – Kommunikationsroboter, die eigenständig mit den Nutzern kommunizieren. Die Bots sollen nicht nur Antworten auf jede erdenkliche Frage liefern, sondern auch individuelle Kundenwünsche erfüllen. Damit es zum direkten Verkaufsgespräch zwischen den Bots und den Nutzern kommt, müssen die Unternehmen Facebook nur Schnittstellen zu ihren Shopsystemen und damit zu ihren Datenbanken bereitstellen.
Aus Sicht der Nutzer bieten die Bots zahlreiche Vorteile. Künftig brauchen sie nicht mehr zwischen verschiedenen Apps wechseln, um unterschiedliche Angebote zu nutzen. Stattdessen erhalten sie via Facebook alles aus einer Hand. Erste Möglichkeiten gibt es bereits: So lässt sich schon jetzt die aktuelle Nachrichten- und Wetterlage über den Messenger abfragen – CNN und der Dienst Poncho bieten hier erste Bots an. Und der Internethändler „Spring“ ermöglicht es, Schuhe per Verkaufschat zu ordern.
Dass ausgerechnet Facebook auf dialogbasierte Computer setzt, hat einen guten Grund: In der Vergangenheit sind dessen Versuche kläglich gescheitert, die Dominanz Apples und Googles auf dem Markt mobiler Betriebssysteme zu brechen. Seinen neuen Assistenten hingegen könnte Facebook – gleich einem trojanischen Pferd – auf die Smartphones jedes Herstellers einschleusen. Die geschlossenen Systeme von Google und Apple ließen sich dann von innen heraus besetzen.
Die Nutzer werden sich an die neue Dauerpräsenz der Kommunikationsroboter vermutlich erst einmal gewöhnen müssen. Denn die Bots sollen sich jederzeit auch in privateste Gespräche einmischen: Verabreden sich beispielsweise zwei Nutzer per Messenger-App zum Essen, schlägt der Assistent prompt eine Auswahl umliegender Restaurants vor. Eine kurze Anweisung soll genügen – und der passende Tisch wird reserviert.
Im Zweifel für die Bequemlichkeit
Allerdings präsentieren die Bots nur eine stark eingeschränkte Angebotspalette. Denn die Assistenten greifen zuallererst auf die Schnittstellen ausgewählter Kooperationspartner zu: Amazon statt eBay, Bing statt Google, Spotify statt Deezer, Yelp statt TripAdvisor. Damit gleicht das System einer Suchmaschine, die nur bestimmte Webseiten abfragt – und zwar eben jene, deren Inhaber den Konzernen am meisten dafür zahlen. Mit den Prinzipien eines offenen World Wide Webs hat dies nur noch äußerst wenig gemein.
Dennoch werden sich die Bots wahrscheinlich durchsetzen – und damit wahrscheinlich die Nutzung des Internet geradezu revolutionieren. Denn aus Sicht vieler wird einmal mehr der Wunsch nach Bequemlichkeit überwiegen. Und in der Tat war Einkaufen nie leichter: So muss der Bot nur Größe, Material und Farbe erfragen, um innerhalb weniger Sekunden eine geeignete Auswahl an Schuhen zu präsentieren. Auf die gleiche Weise kann er die Morgennachrichten zusammenstellen, den nächsten Roman empfehlen oder auf ein neu eröffnetes Geschäft in der näheren Umgebung aufmerksam machen. Und sind die Adress- und Kreditkartendaten erst einmal hinterlegt, lassen sich die Bezahlprozesse ebenfalls weitgehend automatisch und im Hintergrund abwickeln.
In der schönen neuen Servicewelt sind dabei jene Konzerne im Vorteil, die bereits in den vergangenen Jahren sämtliche Daten ihrer Nutzer abgegriffen und ausgewertet haben. Vor allem Facebook hat hier die Nase vorn, kennt es doch die Interessen seiner weltweit rund 1,3 Milliarden Nutzer ganz genau. Aber auch der Suchmaschinengigant Google weiß recht detailliert, was seine Kunden wünschen.
Doch die Konkurrenz schläft nicht – und will die Bots sogar zu unseren Mitbewohnern machen. Wie das aussehen soll, hat der Internethändler Amazon bereits eindrucksvoll vorgemacht. Dessen digitaler Diener „Echo“ hat die Form eines knapp 25 Zentimeter hohen Zylinders, in dem Lautsprecher und Mikrofon untergebracht sind. Einmal angeschlossen, kann man per Sprachbefehl alle möglichen Produkte ordern, ausgewählte Filmtitel suchen oder das Baujahr des Eiffelturms erfragen.
Das Gerät ist in den USA seit gut einem Jahr für knapp 180 US-Dollar erhältlich; mehr als drei Millionen der Assistenten hat Amazon bereits verkauft. Der Erfolg hat die Rivalen gehörig aufgeschreckt. Mitte Mai stellte Google daher ebenfalls einen vernetzten und zuhörenden Lautsprecher namens „Google Home“ vor.
Die Kunden stört es offenbar nicht, dass ihr digitaler Diener sämtliche Gespräche belauscht. Die Systeme werden in der Regel auf Zuruf aktiviert. So wartet Amazons Assistenten geduldig auf das Signalwort „Alexa“ (so lautet der Name des sprachgesteuerten Programms), um dann konkrete Anweisungen entgegenzunehmen. Dabei kommt es aber offenbar immer wieder zu Fehlfunktionen: Nutzer berichten, dass „Alexa“ ohne explizite Aufforderung inmitten eines Gesprächs reagiert und wahllos Produkte bei Amazon bestellt.
Die Datafizierung der Stimme
Hinzu kommt, dass die „Datafizierung“ von Millionen Stimmen eine anonyme Webnutzung künftig erheblich erschwert. Ist man noch ganz altmodisch mit Maus oder Tastatur unterwegs, lassen sich Webdienste nutzen, ohne die eigene Identität preiszugeben. Selbst bei Einkäufen kann man auf anonyme Zahlungsmethoden wie BitCoin ausweichen.
Ersetzt jedoch künftig die menschliche Stimme das Passwort, lassen sich jede Abfrage, jeder Befehl, ja nahezu jedes belauschte Gespräch einzelnen Personen zuordnen. Somit ist der Nutzer, sofern er seine Stimme nicht künstlich verfremdet, kaum noch in der Lage, sich unerkannt im Netz zu bewegen.
Aber auch in der „realen Welt“ bleibt man dank des Dauerlauschens nicht unerkannt: Sind sprachbasierte Dienste erst einmal allerorten installiert, kann ein Großteil unserer Gespräche auf Schritt und Tritt abgehört werden – nicht nur in den eigenen vier Wänden, sondern auch im Bus, in der Fußgängerzone oder im Café.
Mit vergleichsweise geringem Aufwand ließen sich so auch umfassende Bewegungsprofile einzelner Personen und ihres sozialen Umfelds erstellen. Dieses enorme Überwachungspotential dürfte auch den Geheimdiensten nicht verborgen geblieben sein. Anfang Mai erkundigte sich der US-Journalist Matt Novak daher beim FBI, ob der Dienst auch Amazons „Echo“ nutze, um Personen abzuhören.
Allzu weit hergeholt ist dieser Verdacht nicht: Erst Mitte Mai wurde bekannt, dass das FBI in San Francisco in den Straßen rund um ein Bundesgericht für die Dauer eines knappen Jahres versteckte Mikrophone installiert hatte – ohne zuvor eine richterliche Genehmigung eingeholt zu haben. Ob das FBI nun auch digitale Assistenten für seine Lauschangriffe nutzen werde, wollte der Geheimdienst „weder bestätigen noch verneinen“.
Überwachung außer Kontrolle?
Schon jetzt ist abzusehen, dass die sprachbasierten Assistenten gewaltige Auswirkungen haben werden: auf den digitalen Markt, unsere Konsumgewohnheiten und – nicht zuletzt – auf unser aller Privatsphäre.
Die Sorge darüber speist sich weniger aus kulturpessimistischer Technikskepsis, als vielmehr aus der schon jetzt immensen Marktmacht der Konzerne. Heute gibt es in nahezu jedem deutschen Haushalt gleich mehrere Smartphones, Tablets und Computer, die in der Regel dauerhaft mit dem Internet verbunden sind. Auf diesen Geräten laufen künftig die sprachgesteuerten Applikationen, mit denen die Unternehmen noch weiter in die Privatsphäre jedes Einzelnen vordringen können, als sie es ohnehin schon tun.
Insbesondere zwei Aspekte machen diese Aussicht so bedrohlich: Erstens unterliegen die Konzerne – im Gegensatz zu staatlichen Behörden – kaum rechtlichen Beschränkungen. Davon profitieren aber ausgerechnet die Geheimdienste: Sie nutzen die fehlende Kontrolle – das wissen wir spätestens seit den Snowden-Enthüllungen – allzu gerne, um die Bürgerinnen und Bürger in Zusammenarbeit mit den Konzernen auszuspähen.
Vor dieser Ausspähung aber können sich – zweitens – nicht einmal jene Nutzer schützen, die sich gegen die sprachgesteuerte Technik entscheiden. Umso dringlicher sind verbindliche Vorgaben, wann die Konzerne welche Daten erheben, auf ihren Servern speichern und auswerten dürfen. Andernfalls verwandelt sich die optimistische Utopie tatsächlich unausweichlich in eine düstere Überwachungsdystopie. Wie diese aussehen kann, wissen wir ebenfalls aus zahlreichen Science-Fiction-Klassikern wie „Alphaville“, „Minority Report“ – oder auch „1984“.
Eine längere Version dieses Textes erschien in den »Blättern für deutsche und internationale Politik« (www.blaetter.de).
Daniel Leisegang ist Redakteur bei der Monatszeitschrift Blätter für deutsche und internationale Politik (www.blaetter.de) und schreibt vor allem zu den Themen Medienentwicklung, Netzpolitik, politische Theorie, Grundrechte und Datenschutz. Seit April 2015 ist er zudem Vorsitzender des log.os Fördervereins e.V. (www.logos.vision). Außerdem gehört er dem Editorial Board von Eurozine (www.eurozine.com) an. Zuletzt erschien von ihm im Schmetterling Verlag das Buch „Amazon – Das Buch als Beute“. 2016 wurde er für seine Medienkritik „Facebook rettet die Welt“ mit Sonderpreis Medienkritik der Zweiten Aufklärung aus Berlin ausgezeichnet.
Kommentar hinterlassen zu "Daniel Leisegang: Der Lauschangriff des Silicon Valley"