Zu viele Buzzwords im Data Science? Was sind die Unterschiede zwischen KI, Algorithmen, Machine Learning und Deep Learning?

Vielen sind die Unterschiede der zentralen Begriffe aus dem Data Science / Big Data und KI-Umfeld nicht zwingend bekannt — das mussten wir in unseren Beratungsmandaten immer wieder feststellen. Dieser Beitrag leistet den Versuch einer kurzen Einordnung und Erläuterung der Technologien hinter den Begriffen.

Photo by Stephen Dawson on Unsplash

Am Anfang steht der … Algorithmus

Unter dem Terminus Algorithmus versteht man eine eindeutige bzw. definierte Handlungsvorschrift zur Lösung eines Problems oder einer Klasse von Problemen. Dabei setzen sich Algorithmen aus Einzelschritten zusammen, die wohldefiniert sind und so auf einer Maschine ausgeführt werden können.

Algorithmen können aber auch in menschlicher Sprache ausformuliert werden, beispielsweise zur Erfassung eines Realwelt-Problems. So beschreibt ein Kochrezept (das Programm) den Vorgang, der notwendig ist, aus Einzelbestandteilen (Input/Output) eine bestimmte Speise herzurichten (Algorithmus).

Ein Algorithmus ist somit eine Menge von Regeln für ein Verfahren, um aus Eingabegrößen bestimmte Ausgabegrößen herzuleiten. Dabei sind folgende Bedingungen zu erfüllen:

Finitheit der Beschreibung: Das Verfahren muss in einem endlichen Text vollständig beschrieben sein. Die elementaren Bestandteile der Beschreibung sind dabei die Einzelschritte.
Effektivität: Jeder einzelne Schritt des Verfahrens muss tatsächlich ausführbar sein.
Terminierung: Das Verfahren kommt in endlich vielen Schritten zu einem Ende.
Determiniertheit: Der Ablauf des Verfahrens ist zu jedem Punkt fest vorgeschrieben.

Was unterscheidet nun einen regulären Algorithmus von einem Algorithmus für maschinelles Lernen?

Zunächst einmal hat der vorhergehende Abschnitt gezeigt, dass nicht alle Algorithmen speziell mit KI oder maschinellem Lernen zusammenhängen. Aber: Algorithmen liefern die Anweisungen für fast jedes KI-System, mit dem wir es aktuell zu tun haben. Der Unterschied ist, dass KI-basierte Algorithmen nicht einem strikten Ablauf folgen und eben nicht regelbasiert vorgehen. Anstatt nur explizit programmierten Anweisungen zu folgen, sind KI-Algorithmen so konzipiert, dass Computer selbstständig lernen.

Die große, mystische Klammer um alles: Künstliche Intelligenz

Unter Künstliche Intelligenz (KI) verstehen wir Technologien, die sich am Aufbau und der Arbeitsweise unseres menschlichen Gehirns orientieren. Dabei umfasst KI ein ganzes Set an Prinzipien, Methoden und Techniken, darunter Neuronale Netze, Regressionsanalysen, Maschinelles Lernen, Deep Learning oder das Erkennen und Verarbeiten menschlicher Sprache.

Neu ist das Thema auch nicht: Die Algorithmen für KI sind alt und wurden bereits in den 50er und 60er Jahren hinreichend entwickelt. Das Problem damals bestand nur darin, dass es weder ausreichend schnelle Computer gab, noch genügend Trainingsdaten. Cloud-Storage, unbegrenzte Rechenpower in Serverfarmen, Internet of Things und Sensorik sowie die vollständige Vernetzung der Menschheit (Smartphone, Smartwatch, Tablets, …) sorgen dafür, dass genau diese Hindernisse nun endgültig beseitigt sind.

Zentrales Element und wirksamer Faktor für die Ergebnisqualität von KI-Modellen sind Daten. Vielen Daten. Hochwertige Daten. Fehlerfreie Daten. Diese Daten werden genutzt, um eine KI zu trainieren und anschließend, mit weiteren Daten, zu testen. Die Optimierung von Daten sowie des passenden Modells für den KI-Algorithmus gehört so zum Tagesgeschäft von Datenanalysten.

Maschinelles lernen: Muster erkennen und anhand von Daten lernen

Maschinelles Lernen ist eine Teilmenge der KI, bei der Maschinen trainiert werden, um aus Datensätzen zu lernen und hieraus neue (für den Menschen nicht ummittelbar nachvollziehbare) Erkenntnisse zu gewinnen und vorausschauende Entscheidungen vorzubereiten. Durch das Erkennen von Mustern in vorliegenden (umfangreichen) Datenbeständen sind Maschinen in der Lage, eigenständig Lösungen für Probleme zu finden.

Machine Learning automatisiert Aufgaben und findet Muster oder Anomalien, lernt aus diesen und erstellt neue Regeln für weitere, vergleichbare Fälle. So wird — analog zum Menschen — der Algorithmus immer präziser und damit besser.

Aber nicht nur die wachsende Präzision ist ein Vorteil von maschinellem Lernen; durch die umfangreiche Rechenpower der heutigen Systeme (die skalierbare Cloud eingeschlossen) lassen sich ganze Problemklassen lösen, die man bislang mit regelbasierten Algorithmen nicht hätte bearbeiten können.

Damit ML-Algorithmen eigenständig lernen und Lösungen finden können, müssen die Systeme mit relevanten Daten versorgt werden. Darüber hinaus sind Regeln für die Analyse des Datenbestands und das Erkennen der Muster aufzustellen. Sind Daten vorhanden und Regeln definiert, kann die Maschine Vorhersagen auf Basis der analysierten Daten treffen oder
Wahrscheinlichkeiten für bestimmte Ereignisse berechnen.

Deep Learning: Mehrschichtige Intelligenz aufbauen

Deep Learning ist derzeit die am weitesten fortgeschrittene Untergruppe des maschinellen Lernens. Deep Learning ist eine weitere Untergruppe der KI, mit der Maschinen so nah wie möglich an das menschliche Denken herangeführt werden. Der Algorithmus lernt dabei, Muster in völlig unstrukturierten Daten unterschiedlicher Formate (Texte, Sprache, Audio, Video, Bilder) zu erkennen. Diese Erkennung wird in einem neuronalen Netz umgesetzt, das in Schichten organisiert wird. Was genau zwischen den Schichten passiert, ist aktuell noch nicht nachvollziehbar und lässt sich mit bisherigen Technologien auch noch nicht “debuggen”.

Systeme, die heute schon Sprache erkennen und interpretieren, Audio-, Video- und Bilddaten verstehen und auch Objekte in Videos und Bildern erkennen, werden mit Deep Learning realisiert. Aufgrund der Vielschichtigkeit sind Deep Learning Algorithmen extrem rechenintensiv und werden in der Regel in großen Rechenzentren oder aber in der Cloud (AWS, Azure, IBM Bluemix, google cloud) realisiert.

Wir verstehen uns (oder?) — Verarbeitung natürlicher Sprache (NLP)

NLP steht für “Neuro–Linguistisches Programmieren” und ist ein Kommunikations-Modell mit Ansätzen aus der Psychologie, der Hypnose und den Sprachwissenschaften. NLP ist die Basis heutiger Algorithmen zur Spracherkennung durch Maschinen.

Die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) ist ebenfalls ein Element des Deep Learnings, bei dem Text oder menschliche Sprechweisen übersetzt werden, damit ein Computer sie kategorisieren und verstehen kann.

In Kombination mit einer semantischen Analyse kann ein intelligentes NLP-Modell auch den Kontext untersuchen, um die Bedeutung eines Satzes oder einer Aussage zu bestimmen. Einsatzgebiete von NLP-basierten Systemen sind Sprachassistenten, intelligente Suchen und Automatisierungen, die mittels Sprache gesteuert werden. Insbesondere der Zugang durch Sprache zu technischen Systemen soll verbessert werden, so dass der Sprachzugang dem menschlichen Denken möglichst ähnlich ist. Auch moderne Chatbots (z.B. auf Basis IBM Watson) arbeiten heute mit NLP-Algorithmen, um den Sprachzugang möglichst menschennah abzubilden.

Fazit: Mit den richtigen Werkzeugen die eigenen Daten optimal nutzen

Gerade weil der technologische Fortschritt unbändig voranschreitet, müssen sich Unternehmen heute schon mit den Disruptionen von Morgen beschäftigen. Daten und prediktive Datenanalysen sind der Treibstoff für den digitalen Wandel, für Plattformanbieter, für Netzwerkeffekte.

KI und die sich subsummierenden Technologien werden in Zukunft eine gewichtige Rolle in allen Märkten, Produkten und Services spielen. Der sichere Umgang mit den eigenen Daten (Stichwort: Datenanalysen, Aufbau eines Data Lakes) ist heute wichtiger denn je. Nur wer sich als Unternehmen richtig vorbereitet und sicher aufstellt, kann von der Entwicklung profitieren.

40° hilft Ihnen dabei, genau diesen Herausforderungen sicher und zielgerichtet zu begegnen und Ihre Organisation für den Umgang und die Nutzung von Daten und Datenanalysen sowie Künstlicher Intelligenz vorzubereiten und erste Projekte umzusetzen.

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade