Wie werden KI‘s eigentlich trainiert? Ein Einblick in Supervised Learning.
Das Thema Künstliche Intelligenz (KI) ist allgegenwärtig und betrifft uns früher oder später alle. Doch was verbirgt sich eigentlich hinter der Faszination KI? Wie funktioniert sie und welche Auswirkungen hat sie auf unser alltägliches Leben und die Zukunft unserer Gesellschaft? Mit der neuen e-dynamics Blogbeitragsserie möchten wir ein tieferes Verständnis für KI fördern und dazu einladen, die spannenden Möglichkeiten sowie die damit verbundenen Herausforderungen anhand von Beispielen aus der Praxis kennenzulernen. Begleitet uns in die faszinierende Welt der Künstlichen Intelligenz!
In unseren ersten beiden Beiträgen haben wir mit den Basics gestartet: Was ist überhaupt eine KI? und Inwiefern unterscheiden sich KI’s voneinander?
Mit dem dritten Beitrag der Serie tauchen wir etwas tiefer in die Materie ein und widmen uns der Frage, wie KI’s trainiert werden und unterscheiden dabei zwischen Supervised Learning, Unsupervised Learning und Reinforcement Learning.
In dieser Ausgabe widmen wir uns dem Supervised Learning oder auch „überwachtes Lernen“ im Deutschen. Dabei wird ein Modell auf der Grundlage von bereits gelabelten Daten trainiert, d.h. der Input der KI ist vorab mit der gesuchten Information versehen bzw. gelabelt, bspw. ob eine Mail Spam ist oder welches Tier auf einem Bild zu sehen ist. Das Modell lernt die Beziehung zwischen den Eingabedaten und den dazugehörigen Labels zu erkennen und zu generalisieren.
Die einzelnen Trainingsschritte
1. Datensammlung
Im ersten Schritt werden Daten gesammelt. Es wird zwischen Input- oder Eingabe-Daten und Output bzw. „Label“ unterschieden und beide Informationen müssen für jede Dateneinheit zur Verfügung stehen. Dies stellt die erste und womöglich größte Herausforderung im gesamten Trainingsprozess dar. Nicht selten müssen die Daten sogar zuvor manuell gekennzeichnet werden, was je nach Aufgabe sehr zeitintensiv ist. Beispielsweise lagern große Unternehmen diesen Schritt aus, indem User zum Zweck von Anti-Bot Maßnahmen auf Bildern Ampeln oder Fahrräder erkennen sollen.
2. Vorverarbeitung der Daten
Wie bei jeder Datenverarbeitung, müssen auch beim KI-Training die Daten vorher bereinigt und eventuell transformiert werden. Auch das Aufteilen der Daten in Trainings– und Testdaten gehört zu diesem Schritt. Das Ziel dabei ist, dass das Modell auf den Trainingsdaten lernen und auf den Testdaten evaluiert werden kann. Diese Aufteilung wird vorgenommen, um Overfitting-Effekten entgegenzuwirken, also dem Modell beizubringen für möglichst allgemeine Datensätze gut zu funktionieren und nicht nur für den Trainingsdatensatz.
3. Modellwahl
Als nächstes wird ein geeignetes Verfahren zur Berechnung des Outputs ausgewählt. Zu den klassischen Methoden im Supervised Learning gehören unter anderem die lineare Regression, Entscheidungsbäume, K-nearest Neighbors (KNN) oder auch neuronale Netze und Deep Learning. Je nach Art der Daten und der initialen Fragestellung, ist ein Verfahren besser oder schlechter geeignet. Die Verfahren zeichnen sich jedoch alle dadurch aus, dass sie über bestimmte Stellschrauben bzw. Parameter verfügen, welche die Güte des Ergebnisses maßgeblich beeinflussen. Die Berechnung der optimalen Parameter ist das Ziel des gesamten Trainingsprozess.
4. Training des Modells
Das eigentliche Training kann beginnen: Die gewählte Methode wird mit geeigneten Startparametern versehen und lernt anhand der Trainingsdaten Muster und Zusammenhänge zwischen den Eingabewerten und den Labels zu erkennen.
5. Evaluierung und Optimierung
Nun wird das Modell auf den Testdaten evaluiert. Hierbei wird gemessen, wie gut das Modell generalisieren kann, d.h. wie präzise die Vorhersagen von ungesehenen Daten ist. Typischerweise wird nach dem ersten Durchlauf mit Trainings- und Testdaten kein optimales Ergebnis erwartet. Der Name Supervised Learning suggeriert jedoch schon, dass es sich um einen Lernprozess handelt, weshalb die Schritte 4 und 5 mehrmals durchlaufen werden, häufig sogar für mehrere Methoden mit unterschiedlichen Startparametern parallel. Dabei werden die Parameter sukzessive in die Richtung angepasst, bis ein annährend optimales Ergebnis erreicht wird. Techniken wie Cross-Validation oder Hyperparameter-Tuning können bei der Optimierung unterstützen.
6. Veröffentlichung und Anwendung
Ist ein ausreichendes Güteniveau erreicht, so kann das errechnete Modell für reale Anwendungen genutzt werden. Das Modell ist nun in der Lage auch unbekannte Datensätze mit hoher Genauigkeit mit den entsprechenden Labels zu versehen.
Vorsicht ist jedoch geboten, falls die zu verarbeiteten Datensätze sich ändern oder die Funktionalität des Modells erweitert werden soll. Dies kann nämlich nur nach einer erneuten Trainingsroutine zuverlässig gewährleistet werden.
Vorteile und Herausforderungen von Supervised Learning
Wie bei jeder Lernmethode gibt es auch beim Supervised Learning einige Vorteile, aber auch Herausforderungen, die wir im Folgenden einmal betrachten werden.
Vorteile:
- Hohe Genauigkeit: Das Modell wird mit „richtigen“ Labels trainiert, was dazu führt, dass die Vorhersagen oft sehr präzise sind
- Simpler Ansatz: Der Trainingsansatz ist verständlich und leicht zu implementieren, sodass gute Trainingsergebnisse mit genügender Rechenleistung erzielt werden können.
Herausforderungen:
- Datenabhängigkeit: Die Güte des Modells ist sehr stark von der Datenqualität und der Datenverfügbarkeit abhängig. Sind die Daten unzureichend annotiert, führt dies zu schlechten Ergebnissen. Hinzu kommt, dass die Annotation sehr teuer und aufwendig sein kann, denn je mehr Daten zu Trainingszwecken zur Verfügung stehen, umso besser funktioniert das Modell im Nachhinein.
- Rechenintensiv: Durch die Größe des Datensatzes und die Wiederholung der Trainingsschritte ist der Gesamtprozess sehr rechenintensiv und benötigt teilweise ganze Rechenzentren, um akzeptable Ergebnisse zu liefern.
- Overfitting und Bias: Sind die Trainingsdaten schlecht gewählt, indem bspw. nur eine Teilmenge der Gesamtheit der Daten genutzt wird, so kann das Modell auch niemals auf der Gesamtheit der Daten gute Ergebnisse liefern. Zusätzlich kann es passieren, dass der Trainingsprozess zu exzessiv auf den Trainingsdaten durchgeführt wurde, sodass das Modell nicht mehr in der Lage ist die Ergebnisse auf andere Datensätze zu generalisieren.
Anwendungsbeispiele
- KI-Systeme können mittels bereits gelabelter Röntgenaufnahmen oder MRT-Scans trainiert werden, um in der medizinischen Diagnostik Krankheiten zu diagnostizieren.
- Large Language Models (LLM’s) wie bspw. ChatGPT werden ebenfalls häufig mittels Supervised Learning trainiert.
Fazit
Das Supervised Learing ist eine mächtige Methode um Künstliche Intelligenzen zu trainieren. Es bietet einen simpler Ansatz, welcher verständlich und nachvollziehbar ist. Dennoch birgt es auch große Herausforderungen. Riesige Mengen gelabelter Daten sind notwendig und das Training ist sehr rechenintensiv.
Eine weitere Methode, um KI’s zu trainieren ist das Reinforcement Learning. Im nächsten Blogpost widmen wir uns diesem Trainingsansatz. Stay Tuned!
STARTET JETZT MIT UNSERER EXPLAINABLE AI-ALLZWECKWAFFE DURCH!
ED.DETECT AUTOMATISIERT EURE PROZESSE & SORGT FÜR DEN MAXIMALEN BUSINESS BOOST.
Findest Du das Thema KI spannend oder hast Du Fragen zu den unterschiedlichen Trainingsmethoden von Künstlicher Intelligenz? Dann melde Dich gerne direkt bei uns.