Im Herbst hat Hertha gegen Frankfurt 1:0 gewonnen und war damit auf dem 6. Platz der Bundesliga. Verblüffend ist nicht, dass Hertha im ersten Tabellendrittel ist, sondern die Bandenwerbung im Olympiastadion. Neben dem Hauptsponsor Herthas “Tedi” (ich weiß immer noch nicht, was die mir verkaufen wollen) werden während eines Spiels am Spielfeldrand werbewirksam fürs Fernsehen andere Produkte eingeblendet. Diese Werbeflächen sind nicht billig, erreichen bei einem überdurchschnittlichen Bundesligaspiel Millionen von Zuschauern am Bildschirm und 50.000+ im Stadion. Neben erwartbaren zielgruppenspezifischen Werbungen für Baumärkte oder Garagentore lief dieses Mal diese Bandenwerbung:
Da ich davon ausgehe, dass nur ein geringer Teil der Zielgruppe Mandarin lesen kann, frage ich mich: Wer gibt so viel Geld aus für Botschaften, die kaum jemand versteht? (Auflösung am Ende.)
Und damit sind wir schon beim Thema:
Willkommen zur “Künstlichen Intelligenz”
Derzeit erwähnt praktisch jede Publikation die Worte “künstliche“ und “Intelligenz”, vorzugsweise in Kombination, um daraus eine mahnende oder rosige Zukunft zu skizzieren. Es gibt nur ein riesiges Problem: die meisten Menschen haben keine Ahnung, was eigentlich mit “künstlicher Intelligenz” (KI) gemeint ist.
Wenn es nur “die Hälfte der Deutschen” wäre, die keine Ahnung hätten – sei’s drum. Prekär wird es, wenn Entscheider in den Unternehmen “Irgendwas mit KI” machen wollen und keine Ahnung haben:
Ich kenne mich ein bisschen hier und da aus, aber zu welcher Hälfte würde ich mich in Bezug auf “KI” einordnen? Die Diskussionen wechselten zwischen Extremen, die ich nicht bewerten konnte: ist es eine Dystopie, die den Untergang der Menschheit prophezeit? Oder ist es eine Verheißung, die Lösung all unserer Krankheiten und menschlichen Schwächen? Oder ist es einfach nur heiße Luft und morgen reden wir wieder über Blockchain und das Ende der Demokratien?
Ich habe mich also in den letzten Monaten mit diesem Thema beschäftigt und versucht, mich schlau zu machen, was es mit KI auf sich hat.
In diesem Text möchte ich erklären, was “KI” überhaupt ist.
Seit der Steinzeit ist “das Unverständliche” immer eine diffuse Bedrohung, denn solange es “unverständlich” ist, weiß man nicht, ob es nicht auch die eigene Existenz oder Lebensplanung betrifft.
Ein Blick auf die aktuellen politischen Verwerfungen offenbart eine zutiefst verunsicherte Wahrnehmung. Alles Fremde, alle sicher geglaubten Annahmen bezüglich der eigenen gesellschaftlichen Verortung, alles “Neue” stellt eine potenzielle Bedrohung dar. “Künstliche Intelligenz” bedient genau diese Bedrohungsszenarien, zumindest solange man nicht weiß, worum es eigentlich geht.
Ich möchte hiermit etwas Luft aus dem Kessel lassen. Denn noch bin ich zuversichtlich, dass die KI am Ende gar nicht so bedrohlich ist – weder im Guten noch im Bösen. Und je mehr man über das Unbekannte weiß, desto weniger Angst muss man haben und erhält freie Sicht auf die realistische Situation.
Was ist KI?
Der Begriff “Künstliche Intelligenz” (KI) ist eine Marketing Erfindung. Zehn Wissenschaftler planten 1956 eine Konferenz und benötigten dringend Fördermittel. Es gelang ihnen mit der knackigen Überschrift “Project on Artificial Intelligence” die Rockefeller Foundation zu überzeugen und sie erhielten 13.500 US$ Fördermittel. Der Begriff “Artificial Intelligence“ war geboren (“Künstliche Intelligenz”, KI).
KI ist eine technische Umschreibung für Software, die Probleme lösen kann, von denen man meint, dass dazu eigentlich nur ein Mensch in der Lage ist. Mit dem technologischen Fortschritt wurde im Laufe der Jahrzehnte die Messlatte für diese technischen Problemlöser immer weiter nach oben verschoben, so dass sich die Definition laufend geändert hat. Ein Taschenrechner in den 70er Jahren des vergangenen Jahrhunderts konnte mathematische Aufgaben viel schneller lösen als Menschen oder Rechenschieber es bis dahin konnten. Damals hätte mein langjähriger Schulbegleiter, der TI-30, der Definition als “KI” entsprochen.
Als vor ca. 20 Jahren IBM mit dem Computer “Deep Blue” den damaligen Schachweltmeister besiegte, war eine Maschine auch auf diesem Gebiet besser als ein Mensch – etwas, das bis dahin als nicht möglich erschien. Trotzdem sagt IBM heute, dass “Deep Blue” kein KI-Programm war. Das liegt daran, dass der Begriff KI inzwischen im Zusammenhang mit ganz anderen Modellen und Mechanismen verstanden wird.
KI ist immer schwach
Grob unterscheidet man heute zwischen zwei unterschiedlichen Konzepten: “starker” und “schwacher” KI. “Starke KI” soll menschen-ähnlich fühlen und entscheiden können, also so etwas wie ein Bewusstsein, Werte und Gefühle haben. Das ist aber noch immer Science Fiction-Material! Nicht nur, dass so etwas wie eine “starke KI” auf absehbare Zeit nicht in Sicht ist, es gibt noch nicht einmal ein theoretisches Modell, dass diesem Anspruch genügen würde. Je nach Blick in die Glaskugel kann es noch 30 oder 100 Jahre dauern, ehe etwas Ähnliches gebaut werden könnte. Aber wie das mit den Vorhersagen so ist: Sie sind kompliziert, vor allem wenn es um die Zukunft geht.
Wenn derzeit von “KI” die Rede ist, ist immer “schwache KI” gemeint. Und diese wiederum ist immer gleichzusetzen mit “Machine Learning” (ML). ML unterscheidet sich von klassischer Software dadurch, dass die ML-Software sich die Regeln für die Lösung eines Problems selber erarbeitet. Dies geschieht durch ständige Annäherung an das gewünschte Ergebnis. Und damit ist auch schon offensichtlich, dass der Begriff “Intelligenz” irreführend ist, denn Maschinen sind nie intelligent. Um die Begrifflichkeit noch weiter zu präzisieren: alle ML-Programme arbeiten nach dem gleichen Prinzip, nämlich dem von “künstlichen neuronalen Netzen” (KNN). Ein KNN ist ein Softwaremodell zur Mustererkennung. Im Gegensatz zu regelbasierter Software, bei der jede Entscheidung schon im Code vorgegeben ist, versucht ein KNN anhand von “Übungen”, selber den Lösungsweg zu “erlernen”, also die richtige Wahrscheinlichkeit zu optimieren. Den Bezug zu biologischen Neuronen lass ich mal weg, da wir alle wissen, dass ein biologisches Gehirn mehr zu bieten hat als Neuronen und Synapsen.
(Teaser: Ohne Heerscharen von modernen Sklaven geht gar nichts – dazu später mehr.)
Wie funktioniert ein KNN?
Ein künstliches neuronales Netz (KNN) kann eine Sache besonders gut, allerdings wirklich nur eine einzige Sache. Es ist wie ein Brot: ein gutes, dummes Brot ist ein unersetzliches deutsches Kulturgut, dessen Fehlen einem immer dann auffällt, wenn man weit weg ist und es vermisst. Aber es ist und bleibt doch nur ein Brot. Ein KNN kann immer nur 1 Sache besonders gut, dann allerdings auch viel besser als ein Mensch, aber auch nicht mehr. Zum Beispiel kann ein KNN trainiert werden, anhand von Bildern eine Tulpe zu erkennen.
Und das geht so:
Zunächst benötigt man viele, sehr viele Bilder von Tulpen. Um das gewünschte Ergebnis zu erhalten, sollten es schon zigtausende sein, besser eine Million.
Ein KNN bekommt nun die Aufgabe, auf einem Bild eine Tulpe zu erkennen, zusammen mit der Information, dass auf dem Bild eine Tulpe zu sehen ist. Das Programm kann auf einem Bild anhand von Konturen verschiedene Konturen erkennen, weiß aber nicht, ob eine Kontur ein Baum, ein Glas oder eine Tulpe ist. Mit jedem weiteren Bild kann es Gemeinsamkeiten der bisher “gesehenen” Konturen bestimmen, und da ein Baum und ein Glas nicht mehr so oft vorkommen, werden die Eigenschaften einer Tulpenkontur immer wichtiger. Im Wesentlichen ist es reine Statistik: Je mehr gemeinsame Merkmale in allen Bildern gefunden werden, desto höher ist die Wahrscheinlichkeit, dass eine bestimmte Kontur wiedererkannt wird (“sieht, glaube ich, wie eine Tulpe aus”). Ziel ist, dass bei neuen, unbekannten Bildern die Tulpe richtig erkannt wird.
Diese Art ein KNN zu programmieren nennt man “supervised learning”.
Mustererkennung durch “supervised learning” beschränkt sich nicht nur auf Bilder; andere Anwendungsgebiete sind Texterkennung und Spracherkennung. Wer sich jemals mit Siri unterhalten hat, kennt die Grenzen in der Kategorie “supervised learning”.
Der Großteil der heute eingesetzten Anwendungen basiert auf “supervised learning”.
Eine erweiterte Methode nennt sich “unsupervised learning” (unbewachtes Lernen). Bei dieser Methode werden einer KNN z.B. Bilder von verschiedenen Tulpen gefüttert, aber ohne die Information, welche Merkmale eine Tulpe haben kann (Farbe, Blattmuster, Blüte, usw.). Das KNN muss also nicht nur die Konturen einer Tulpe erkennen (wie beim “supervised learning”) sondern auch noch, welche Unterschiede es geben kann. Dafür benötigt man noch mehr Bilder von unterschiedlichen Tulpen und noch mehr Rechenpower. Als Ergebnis soll das KNN nicht nur die Tulpe erkennen, sondern auch welche Merkmale Tulpen unterscheiden und diese richtig zuordnen.
Ars Electronica 2018: Myriad (Tulips) + Mosaic Virus, Anna Ridler (GB)
Ein anderes Beispiel für eine Anwendung des “unsupervised learning” ist die Erkennung von Leberflecken. Hier verarbeitete ein KNN hunderttausende Bilder von gut- oder bösartigen Leberflecken, wobei das Programm von alleine Merkmale (Muster) finden musste, worin sich diese Bilder unterscheiden. Am Ende war das KNN genau so gut wie erfahrene Dermatologen.
Die dritte (noch anspruchsvollere) Methode ist das “reinforcement learning (RL)” (bestärkendes Lernen). Dabei bekommt das KNN bereits während des Prozesses immer wieder Rückmeldungen in Form von Belohnung oder Bestrafung. Diese Methode eignet sich z.B. bei Spielen: Wenn ein KNN verliert, “lernt” es für das nächste Mal, etwas anders zu machen. Im letzten Jahr sorgte AlphaZero von Google für Schlagzeilen, als das Programm die weltbesten Go-Spieler besiegte – mit einem RL-KNN. Etwas unbeachtet von der medialen Aufmerksamkeit hat ein Programm namens Libratus durch die gleiche Methode vier professionelle Spieler im Pokern besiegt (nach nur 15 Millionen Stunden Lernzeit…).
Das legt die Schlussfolgerung nahe, dass Maschinen nur genug Prozessorpower und Daten benötigen, um z.B. auf dem Bild einer Wiese schlagartig alle vierblättrigen Kleeblätter zu erkennen? Ja so ist es, genau das können sie. Nur brauchen sie dafür ganz, ganz viele Bilder von vierblättrigen Kleeblättern, um das Muster zu erkennen.
80% der KI ist reine Handarbeit – von intelligenten Menschen
Woher kommen diese Bilder mit den Kleeblättern, Katzen oder Lilien? Aus Fabriken. Genauer gesagt aus Fabriken, in denen Menschen sitzen, die den ganzen Tag nichts anderes machen als Bilder mit Markierungen zu versehen: Auf diesem Bild ist eine Katze, eine Tulpe, eine Ampel, ein vierblättriges Kleeblatt, …(Festhalten: Wir schreiben das Jahr 2019.)
In einer Firma in Jiaxian, Henan markieren Arbeiter Objekte auf Bildern.
Tausende Arbeiter/innen sitzen in Fabriken und machen nichts anderes, als für etwas mehr als 1 Euro pro Stunde Gegenstände auf Bildern zu markieren.
Rows of mostly young women sit elbow-to-elbow in cheap chairs at this five-storey, Soviet-style factory building on the outskirts of Beijing, staring at their computer screens. Some bring their own cushions for back support. They spend their shifts viewing images from everyday life and “tagging” them with dots, lines and descriptions.
80% des Aufwands eines KNN basiert auf Menschenarbeit nicht nur in China, sondern auch in Mexiko, Indien, Kenia oder Venezuela.
Angestellte in der Kleinstadt von Minquan, Henan
Diese Bilder mit den identifizierten Merkmalen werden dann in eine KNN gefüttert, damit diese dann später zuverlässig eine Lilie oder ein vierblättriges Kleeblatt erkennen kann.
Ein Bild wird zerlegt:
Objekte haben untereinander Beziehungen und Attribute.
In diesem Beispiel:
Woman in shorts.
Woman standing behind man.
Man jumping over fire hydrant (yellow).
Wie so viele Innovationen weist auch diese auf die Vergangenheit, genauer gesagt auf den sogenannten “Mechanischen Türken”, der 1769 von dem österreich-ungarischen Hofbeamten und Mechaniker Wilhelm von Kempelen als erster Schachcomputer gebaut wurde. Die Maschine bestand aus einer Puppe mit Turban und Schnurrbart, die auf einem großen Tisch mit Schachbrett und einem Gewirr aus Zahnrädern saß – und Schach spielte. Des Rätsels Lösung verbarg sich unter dem Tisch, wo ein Spieler saß und durch Drehen der diversen Kurbeln Schachzüge auslöste – ein erster Fall von „human computation“. Heute sitzt niemand mehr unter dem Tisch, sondern an Bildschirmen, an denen tausende von “Klickarbeitern” mit digitaler Akkordarbeit eine Milliardenindustrie am Laufen halten.
Zusammenfassung
- Wenn von KI (künstlicher Intelligenz) die Rede ist, ist immer ein KNN (künstliches neuronales Netz) gemeint.
Jedes KNN muss mit von Menschen markierten Daten versorgt (gefüttert) werden und wird für eine (!), einzige bestimmte Aufgabe programmiert und anschließend trainiert.
Alle KNN basieren auf einem von drei verschiedenen Methoden:
1. supervised learning
2. unsupervised learning
3. reinforcement learningDie meisten Anwendungen heute basieren auf “1. supervised learning”. Und diese wiederum auf händischer Vorarbeit auf der ganzen Welt.
- Es gibt keinen Ersatz für ein gutes Brot. Es mag zwar dumm sein, aber kein Algorithmus kann ein leckeres Brot ersetzen.
In diesem Beitrag wollte ich das Thema KI auf die technischen Grundlagen runterbrechen, um zu zeigen, dass auch KI nichts “Magisches” oder “Intelligentes” beinhaltet. Mit KNN sind heute völlig neue Anwendungen und Lösungen möglich, die bis vor kurzem nicht vorstellbar waren. Zu jeder fantastischen, positiven Utopie gibt es als Gegenpol immer die entsprechende Dystopie, ein Horrorszenario. Um die Zukunft zu gestalten, müssen wir zuallererst wissen, wo wir heute stehen. At the end of the day, ist es wieder einmal nur ein Algorithmus. Je eher wir den verstehen, besser noch: formen, desto besser für uns.
P.S.:
Die Bandenwerbung im Olympiastadion war für yobo, ein Berliner Startup.
Es ist eine App, die wie Instagram funktionieren soll, aber immer mit einen lokalen Bezug. Und da Buchstaben und Worte zu kompliziert scheinen, werden nur noch Emojis verwendet. Die Gründer behaupten, mit “KI” bessere Empfehlungen machen zu können. Wer braucht so etwas? Wo soll da eine “KI” sein, woher haben die das Geld für Bandenwerbung und warum muss die Werbung in Mandarin sein? Keine Ahnung!
P.P.S.: Ethik und Politik
Im nächsten Beitrag will ich versuchen, die Perspektiven und Probleme zu erläutern, die mit KI entstehen. Wie sieht es mit der Zukunft von Arbeitsplätzen aus? Ethische Fragen, kulturelle Entwicklungen, politische und gesellschaftliche Konsequenzen – es ist ein weites Feld. Was meint ihr?