Suche
  • Anna

Buzzword Entwirrung mit Erleuchtungsgarantie

Aktualisiert: 20. Dez 2020

Bevor wir uns mit den vielfältigen Bereichen der künstlichen Intelligenz beschäftigen, sollten wir uns ein paar Gedanken darüber machen, welche Bedeutung hinter diesen ganzen Schlagworten steckt, die in diesem Umfeld herumschwirren. Es ist in jeder wissenschaftlichen Ausarbeitung ein Klassiker: erst einmal definieren worüber man eigentlich spricht! Und auch wenn das auf den ersten Blick eher langweilig scheint, ist es meistens doch sehr spannend festzustellen, dass man teilweise gar nicht weiß worüber man spricht.


Bild von prince_creative: Roboter Maschine. https://pixabay.com/de/illustrations/roboter-maschine-digital-k%C3%BCnstliche-4120890/.


Was ist überhaupt Intelligenz?


Obwohl die Bezeichnung der künstlichen Intelligenz (nachfolgend KI) insbesondere im englischen Sprachraum als Artificial Intelligence bereits seit den 1950er Jahren im Umlauf ist, gibt es bisher keine einheitliche wissenschaftliche Definition zu dem Begriff. Ein Grund hierfür ist, dass schon der Begriff Intelligenz nicht eindeutig definiert ist. Der Duden beschreibt Intelligenz als


„Fähigkeit [des Menschen], abstrakt und vernünftig zu denken und daraus zweckvolles Handeln abzuleiten.“ [1]


Andere Autoren verweisen darauf, dass es nicht “die eine” Intelligenz gäbe, sondern vielmehr eine Vielfalt unterschiedlicher Intelligenzen. Hierzu gehört sprachliche, musikalische, logisch-mathematische oder räumliche Intelligenz sowie körperlich-kinästhetische, intrapersonale und interpersonale, naturalistische, existenzielle, kreative und auch schöpferische Intelligenz.[2] Eine solche Auflistung verdeutlicht die verschiedenen Perspektiven und die Breite der Verständnis-Möglichkeiten, liefert aber keine Definition für die Begrifflichkeit. Man kann nur grob vermuten, dass Intelligenz kognitive Fähigkeiten voraussetzt. Außerdem scheint Erfahrung eine Rolle zu spielen, denn wie schon das Duden-Zitat andeutet, wird aus dem Denken ein bestimmtes Handeln abgeleitet. Da dies fortlaufend geschieht, ist die Zeit und somit die Ansammlung von Erfahrung ein Faktor, der Intelligenz beeinflusst. In Zusammenhang mit der Erfahrung steht dann wiederum die Lernfähigkeit. Der Mensch verarbeitet das Geschehene und bringt es in Verbindung mit vorigen Erfahrungen, woraus zukünftiges Handeln abgeleitet wird.


Geht es präziser für die künstliche Intelligenz?


Einer der Pioniere der KI, John McCarthy, beschrieb das Ziel der KI darin, Maschinen zu entwickeln, welche sich so verhalten würden als hätten sie Intelligenz.[3] Wie ihr bereits ahnt, ist das natürlich eine etwas ungünstige Definition, weil ja der Begriff Intelligenz über keine einheitliche Auslegung verfügt. Amazon beschreibt KI folgendermaßen:


„Künstliche Intelligenz (AI) ist der Bereich der Informatik, der sich mit dem Erwerb kognitiver Fähigkeiten beschäftigt, die in der Regel menschlicher Intelligenz zugeordnet werden. Hierzu zählen Lernen, Problemlösung und Mustererkennung.“ [4]


Auch hier wird auf die menschliche Intelligenz Bezug genommen, die kognitiven Fähigkeiten von KI werden betont und mit der des Menschen verglichen. Außerdem werden konkret die Fähigkeiten zu lernen, Probleme zu lösen und Muster zu erkennen aufgeführt. Die meisten Autoren bevorzugen jedoch den Blickwinkel von Elaine Rich:


„Artificial Intelligence is the study of how to make computers do things at which, at the moment, people are better.” [5]


Diese Definition betont neben der Aneignung von menschlichen Fähigkeiten die Momentaufnahme. Im Jahr 1996 war es eine Sensation als der von IBM entwickelte Computer Deep Blue den damaligen Schachweltmeister Garri Kasparow schlug.[6] Bis dahin gab es keinen anderen Computer, der das geschafft hatte. Ein anderes Beispiel sind Sprachübersetzungen. Bis vor einigen Jahren waren Computer kaum in der Lage, Sprachen angemessen zu übersetzen. Mittlerweile hat es aber einen großen Entwicklungssprung gegeben. Nicht nur der Translator von Google, sondern auch andere Anbieter wie etwa DeepL übersetzen Sprachen immer konkreter und korrekter. Es gibt sogar Apps, die mittels Natural Language Processing gesprochene Sprache verarbeiten und übersetzen.

Wenn es keine einheitliche Definition von einem Begriff gibt, dann muss man zumindest das eigene Verständnis artikulieren. Für diesen Blog verstehen wir KI als eine Kombination der Definitionen von Rich und Amazon. Es geht bei künstlicher Intelligenz um den Erwerb kognitiver (Lern-)Fähigkeiten, damit eine Maschine Dinge tun kann, zu denen zuvor nur der Mensch fähig war.

An dieser Stelle soll noch kurz auf die häufig angeführte Unterscheidung von schwacher künstlicher Intelligenz (Artificial Narrow Intelligence) und starker künstlicher Intelligenz (Artificial General Intelligence) eingegangen werden. Bei Letzterer wird ein Zustand angestrebt, bei dem der Maschine Bewusstsein und Empathie zugeordnet werden. Die Maschine ist von ihren intellektuellen Fähigkeiten dem Menschen gleichwürdig oder übertrifft diesen sogar. Auch wenn eine solche Form der KI Inhalt von diversen Science-Fiction Filmen ist, so ist sich die Forschung bisher einig, dass eine Realisierung in absehbarer Zeit nicht zustande kommt.[7] Es handelt sich hierbei vielmehr um ein „visionär philosophisches Konzept“.[8] Im Gegensatz dazu geht es bei der schwachen KI darum, gezielt Algorithmen für konkrete Probleme zu entwickeln. Die bisher entwickelte KI gehört ausschließlich in diese Kategorie.



KI im Kontext von Machine Learning und Deep Learning


Bevor wir uns nun mit den Begriffen Machine Learning und Deep Learning beschäftigen, möchte ich deren Beziehung zueinander vorwegnehmen. Dies wird in der folgenden Abbildung visualisiert:



Quelle: Eigene Darstellung in Anlehnung an Kirste, Moritz; Schürholz, Markus (2019): Einleitung: Entwicklungswege zur KI. In: Volker Wittpahl (Hg.): Künstliche Intelligenz. Technologie | Anwendung | Gesellschaft. Berlin, Heidelberg: Springer, S. 22.


Es wird deutlich, dass künstliche Intelligenz als Oberbegriff dient, welcher den gesamten Forschungsbereich beschreibt. Es ist also ein sehr weiter Begriff, der nicht genaue Rückschlüsse beispielsweise darüber zulässt, welche Technologie genau zum Einsatz kommt. Maschinelles Lernen ist ein Teilbereich der künstlichen Intelligenz, welcher sich auf lernende Computersysteme konzentriert. Innerhalb dieser Disziplin befindet sich das Deep Learning, eine besondere Form des maschinellen Lernens, bei der künstliche neuronale Netze zum Einsatz kommen, welche selbstständig Strukturen und Beziehungen erkennen.


Wenn Maschinen lernen


Schon Alan Turing hat erkannt, dass man intelligente Computer nicht händisch bis ins kleinste Detail programmieren kann, die Maschine muss selbst (auf Grundlage angemessener Daten) lernen können. Maschinelles Lernen, bzw. Machine Learning (nachfolgend ML), zeichnet sich durch diese Fähigkeit des Lernens und der Generierung von Wissen aus Erfahrung aus.[9] Dennoch gibt es unterschiedliche Konzepte zu diesem Begriff. Das Fraunhofer Institut definiert den Terminus folgendermaßen:


„Als maschinelles Lernen werden Verfahren bezeichnet, in denen ein Algorithmus / eine Maschine durch Wiederholen einer Aufgabe lernt, diese bezüglich eines Gütekriteriums immer besser auszuführen.“ [10]


Buxmann und Schmidt beschreiben ML in ähnlicher Art, es ginge darum eine Maschine mittels Daten zu trainieren, um eine bestimmte Aufgabe zu erfüllen. Als Beispiel führen sie das Erkennen von Hunde- und Katzenfotos auf. Bei einer regulären Software-Entwicklung würde im Code explizit festgelegt werden, dass vier Pfoten, zwei Augen, ein Fell etc. vorhanden sein müssen, um ein Bild als Hunde- oder Katzenfoto einzustufen. Stattdessen werden beim ML dem Algorithmus viele unterschiedliche Fotos von Hunden und Katzen gezeigt. Durch dieses Training lernt die Maschine selbstständig zu erkennen, wann es sich um ein Foto von dem jeweiligen Tier handelt.[11] ML ist nicht fundamental neu, ein Beispiel von ML ist der Spam-Filter bei Emails. ML-Algorithmen lernen bei jeder Email dazu und können dadurch noch präziser kategorisieren, wann es sich um Spam handelt und wann nicht.


Man unterscheidet drei Arten von ML:

Überwachtes Lernen (supervised learning)

Unüberwachtes Lernen (unsupervised learning)

Verstärkendes Lernen (reinforcement learning).


Beim überwachten Lernen erhält die Maschine einen beschrifteten Datensatz. Um auf das vorige Beispiel zurückzugreifen: der Algorithmus erfährt, ob es sich um ein Hunde- oder um ein Katzenfoto handelt. Anschließend wird der Fortschritt des Lernens mit einem Testdatensatz geprüft, welcher nicht über diese Beschriftungen verfügt. Entscheidend ist dann, wie viele Bilder die Maschine korrekt kategorisiert hat. Im Gegensatz dazu werden beim unüberwachten Lernen Datensätze ohne Label vorgegeben. Die Maschine soll nun selbst Gemeinsamkeiten in den Daten identifizieren und entsprechende Cluster bilden. Man würde also die Hunde- und Katzenfotos ohne Label bereitstellen und die Maschine müsste nun feststellen, dass zwei unterschiedliche Tiere abgebildet werden und worin diese sich unterscheiden. Das verstärkende Lernen kombiniert dynamische Programmierung mit dem überwachten Lernen. Das System muss mittels Trial and Error den optimalen Lösungsweg für ein gegebenes Problem finden. Es wird dabei für gute Ansätze belohnt und für negative Schritte bestraft. Das Google System AlphaGo, welches über Lee Sedol im Go siegte, wurde beispielsweise durch verstärkendes Lernen trainiert.


Deep Thought und Deep Learning


Beim Deep Learning (nachfolgend DL) handelt es sich um eine Disziplin des ML, bei welcher künstliche neuronale Netze zum Einsatz kommen. Fast immer wenn heutzutage von KI die Rede ist, wird eigentlich von diesen künstlichen neuronalen Netzen gesprochen. Die nachfolgende Abbildung veranschaulicht die Funktionsweise solcher Netze, die grundsätzlich nach dem Prinzip Eingabe – Verarbeitung – Ergebnis arbeiten, nur dass im Bereich der Verarbeitung komplexe Schichten miteinander interagieren.



Quelle: Kirste, Moritz; Schürholz, Markus (2019): Einleitung: Entwicklungswege zur KI. In: Volker Wittpahl (Hg.): Künstliche Intelligenz. Technologie | Anwendung | Gesellschaft. Berlin, Heidelberg: Springer, S. 30.


Über die Eingabe-Neuronen werden die Daten in die Schicht bzw. den Layer der versteckten Neuronen (Hidden Layer) transportiert. Von großer Bedeutung ist, dass zuvor ein angemessenes Pre-processing der Daten stattgefunden hat, sodass das Netz die Daten korrekt versteht und verarbeitet. In der Verarbeitungsschicht werden die Daten - was wohl nicht überraschend ist - verarbeitet. Hier lernt das Netz. Über die Ausgabe-Neuronen werden die Ergebnisse geliefert. Die Architektur des Netzes ist steuerbar, man kann beispielsweise festlegen, welche Anzahl an Neuronen es in welchem Layer geben soll oder über welche Funktion ein Neuron aktiviert wird. Ebenfalls steuerbar ist der Informationsfluss bzw. die Verbindungen der Neuronen untereinander. Häufig sind die Neuronen von zwei aufeinander folgenden Layern miteinander verbunden, teilweise sind sie aber auch innerhalb eines Layers miteinander verknüpft. Fjodor van Veen und Stefan Leijnen haben einen “Neural Network Zoo” erstellt, der deutlich macht, wie vielfältig diese Netze aufgebaut sein können:


Quelle: https://www.asimovinstitute.org/neural-network-zoo/.


Eine große Rolle spielen beim DL die Gewichte der Verbindungen zwischen den Neuronen. Diese Gewichte beeinflussen maßgeblich den Lernprozess des Netzes, weil darüber entschieden wird, welche und wie viele Informationen von einem Neuron an das Nächste weitergegeben werden. Wenn Informationen nicht nur weitergeleitet, sondern auch zurückgeleitet bzw. rückgekoppelt werden, spricht man zum Beispiel von rekurrenten Netzen. Einige dieser rekurrenten Netze sind auch im Neural Network Zoo abgebildet. Die genaue Funktionsweise eines künstlichen neuronalen Netzes werden wir uns in einem anderen Beitrag detailliert anschauen.

Auch wenn das menschliche Gehirn als konzeptionelles Vorbild für die Bildung der neuronalen Netze genutzt wurde, funktionieren diese doch etwas anders. Dennoch ist es hilfreich für das Verständnis von DL die Funktionsweise des menschlichen Gehirns zu verstehen. David Kriesel hat in seinem Buch “Ein kleiner Überblick über Neuronale Netze” ein sehr verständliches Kapitel über biologische neuronale Netze geschrieben, das ich sehr empfehlen kann.


Und noch mehr Begriffe...


Da der Bereich der KI sich derzeit rasant entwickelt, gibt es eine Vielzahl weiterer Begrifflichkeiten, die im Umlauf sind. An dieser Stelle soll nur kurz auf Einige davon eingegangen werden. KI grenzt sich beispielsweise relativ unklar von Data Science ab. Im Cambridge Dictionary findet man für Data Science diese Definition:


“[T]he use of scientific methods to obtain useful information from computer data, especially large amounts of data.” [12]


Bei Data Science handelt es sich also darum, Daten zu analysieren um daraus Wissen zu generieren und Unternehmensentscheidungen zu erleichtern. Es handelt sich hierbei mittlerweile um ein eigenes Forschungsgebiet, weil die Datenmengen, welche Unternehmen sammeln und verarbeiten können, in den letzten Jahren rasant gestiegen sind. Im Bereich Data Science werden diese Daten mit mathematischen, statistischen oder stochastischen Methoden ausgewertet, die relevanten Informationen werden extrahiert und anschließend visuell dargestellt.[13] Data Mining ist eine bekannte Disziplin der Data Science. Hierbei werden große Datenmengen analysiert, um Vorhersagen zu treffen. Dafür kann auch KI zum Einsatz kommen, was dazu führt, dass man mittlerweile Data Science auch mit Tätigkeiten rund um ML und DL assoziiert und wer als Data Scientist arbeitet, wird regelmäßig mit KI, insbesondere mit künstlichen neuronalen Netzen, zu tun haben.

Häufig ist im Kontext von KI auch von Bots die Rede. Hierunter ist ein Computerprogramm zu verstehen, welches automatisch wiederkehrende Aufgaben erledigt, zum Beispiel Chatbots, Social Bots oder auch Gamebots. Mittels ML können diese Bots ihre Fähigkeiten kontinuierlich verbessern. Mercedes-Benz hat beispielsweise für die E- und S-Klasse den Chatbot Ask Mercedes im Einsatz, welcher auf Grundlage von der KI-basierten IBM-Watson-Conversation-Technologie entwickelt wurde. Der Chatbot kann über natürliche Sprache Hilfestellung bei der Bedienung des Autos leisten und die Fahrzeugfunktionalität erklären.[14] Ein weiteres Beispiel aus den sozialen Medien ist der Chatbot Tay, der eine verhängnisvolle Geschichte geschrieben hat. Tay ging am 23.03.2016 über Twitter an die Öffentlichkeit, ausgestattet mit jugendlicher Sprache und dargestellt als weiblicher Bot. Tay lernte von den Tweets der anderen Nutzer, der Inhalt der Tweets war Grundlage für das weitere Verhalten von Tay. Dies führte jedoch dazu, dass der Chatbot innerhalb von 16 Stunden von Microsoft wieder vom Netz genommen wurde, weil Tay menschenverachtende Tweets wie etwa „Hitler was right I hate the jews“ sendete.[15]

Schließlich sei noch auf die Black-Box Problematik hingewiesen. Da es sich bei DL-Algorithmen um komplexe Systeme handelt, ist es für Entwickler häufig nicht nachvollziehbar, weshalb das System zu bestimmten Ergebnissen kommt. Was genau im Hidden Layer passiert kann kaum nachvollzogen werden. Dieses sogenannte Black-Box Problem führt dazu, dass es schwierig ist, die Ursache für mögliche Fehleinschätzungen herauszufinden. Die künstlichen neuronalen Netze treffen ihre Entscheidungen auf Grundlage der berechneten Gewichtungen, welche nur schwer interpretierbar sind. Wenn die neuronalen Netze also bestimmte Ethnien diskriminieren, indem sie beispielsweise Augen von Asiaten oder die Hautfarbe von dunkelhäutigen Menschen nicht erkennen, ist eine konkrete Fehlerbehebung schwierig. Statt einer Ursachenforschung im trainierten Netz wird dann häufig eine Analyse der Daten durchgeführt. Mittels korrigierter Daten wird das Netz anschließend erneut trainiert. Als Reaktion auf diese Black-Box Problematik hat sich ein Trend entwickelt, der sich “Explainable Artificial Intelligence” nennt. Man hat nämlich festgestellt, dass Menschen einer Maschine eher vertrauen, wenn sie die Funktionsweise der Maschine oder deren Fehler nachvollziehen können. Dies ist ein wichtiges Gebiet, welches in der Forschung immer mehr Aufmerksamkeit erfährt, daher werden wir es uns in einem anderen Beitrag noch genauer anschauen.

Die hier vorgestellten Begriffe zur KI sind längst nicht vollständig, sollen aber eine erste Orientierung liefern. Was für Begriffe kennt ihr noch zum Thema KI?


[1] Duden (2020): Intelligenz, die. Online verfügbar unter https://www.duden.de/rechtschreibung/Intelligenz. [2] Kreutzer, Ralf T.; Sirrenberg, Marie (2019): Künstliche Intelligenz verstehen. Grundlagen - Use-Cases - unternehmenseigene KI-Journey. Wiesbaden: Springer Gabler, S. 2f. [3] Ertel, Wolfgang (2016): Grundkurs Künstliche Intelligenz. Eine praxisorientierte Einführung. 4. Aufl. Wiesbaden: Springer Vieweg, S. 1. [4] Amazon Web Services, Inc. (2020): Was ist künstliche Intelligenz. Maschinelles Lernen und Deep Learning. Online verfügbar unter https://aws.amazon.com/de/machine-learning/what-is-ai/?nc1=f_ls.

[5] Rich, Elaine (1983): Artificial Intelligence. New York: McGraw-Hill. [6] Fischer, Johannes (2016): Als Deep Blue das Genie Garri Kasparow schlug. In: Die Zeit, 11.03.2016. Online verfügbar unter https://blog.zeit.de/schach/als-deep-blue-das-genie-garry-kasparow-schlug/. [7] Bitkom e. V. (2017): Künstliche Intelligenz. Wirtschaftliche Bedeutung, gesellschaftliche Herausforderungen, menschliche Verantwortung. Berlin. Online verfügbar unter https://www.dfki.de/fileadmin/user_upload/import/9744_171012-KI-Gipfelpapier-online.pdf, S. 32, oder Buxmann, Peter; Schmidt, Holger (2019): Grundlagen der Künstlichen Intelligenz und des Maschinellen Lernens. In: Peter Buxmann und Holger Schmidt (Hg.): Künstliche Intelligenz. Mit Algorithmen zum wirtschaftlichen Erfolg. Berlin: Springer Gabler, S. 6. [8] Apt, Wenke; Priesack, Kai (2019): KI und Arbeit – Chance und Risiko zugleich. In: Volker Wittpahl (Hg.): Künstliche Intelligenz. Technologie | Anwendung | Gesellschaft. Berlin, Heidelberg: Springer,, S. 222. [9] Gentsch, Peter (2018): Künstliche Intelligenz für Sales, Marketing und Service. Mit AI und Bots zu einem Algorithmic Business - Konzepte und Best Practices. 2. Aufl. Wiesbaden: Springer Gabler, S. 37. [10] Fraunhofer-Gesellschaft e.V. (2017): Trends für die künstliche Intelligenz. Online verfügbar unter https://www.fraunhofer.de/content/dam/zv/de/publikationen/broschueren/Trends-fuer-die-kuenstliche-Intelligenz.pdf, S. 6. [11] Buxmann, Peter; Schmidt, Holger (2019): Grundlagen der Künstlichen Intelligenz und des Maschinellen Lernens. In: Peter Buxmann und Holger Schmidt (Hg.): Künstliche Intelligenz. Mit Algorithmen zum wirtschaftlichen Erfolg. Berlin: Springer Gabler, S. 8. [12] Cambridge University Press (2020): data science. Hg. v. Cambridge Advanced Learner's Dictionary & Thesaurus. Online verfügbar unter https://dictionary.cambridge.org/de/worterbuch/englisch/data-science. [13] Informatik-verstehen.de (2019): Data Science. Online verfügbar unter https://www.informatik-verstehen.de/lexikon/data-science/. [14] Hildesheim, Wolfgang; Michelsen, Dirk (2019): Künstliche Intelligenz im Jahr 2018 – Aktueller Stand von branchenübergreifenden KI-Lösungen: Was ist möglich? Was nicht? Beispiele und Empfehlungen. In: Peter Buxmann und Holger Schmidt (Hg.): Künstliche Intelligenz. Mit Algorithmen zum wirtschaftlichen Erfolg. Berlin: Springer Gabler, S. 135. [15] Graff, Bernd (2016): Rassistischer Chat-Roboter: Mit falschen Werten bombardiert. In: Süddeutsche Zeitung, 03.04.2016. Online verfügbar unter https://www.sueddeutsche.de/digital/microsoft-programm-tay-rassistischer-chat-roboter-mit-falschen-werten-bombardiert-1.2928421.