Fairness in KI-Systemen
Wie Verzerrungen in ML-Modellen ermittelt und reduziert werden können
Branchenübergreifend verlassen sich Unternehmen zunehmend auf maschinelles Lernen und andere Modelle künstlicher Intelligenz, um menschliche Grenzen bei wichtigen Entscheidungen zu überwinden. In jüngster Zeit haben Forscher die Besorgnis geäußert, dass Big-Data-gesteuerte ML-Modelle die sozioökonomische Ungleichheit verstärken oder gar hervorrufen. Ob beabsichtigt oder nicht, Diskriminierung, die aus algorithmischen Geschäftsentscheidungen resultiert, kann zu ethischen oder rechtlichen Problemen führen. Um das inhärente Reputationsrisiko zu managen und Schadensersatzansprüche zu vermeiden, müssen Unternehmen sicherstellen, dass ihre datengesteuerte Entscheidungsfindung fair bleibt.
In diesem Artikel definieren wir Fairness für ML-Zwecke und erläutern, wie die Verwendung von verzerrten Daten in ML-Modellen zu diskriminierenden Vorhersagen führen kann. Zudem werden Algorithmen vorgestellt, die Verzerrungen in den Daten verhindern.
Um Verzerrungen in Daten zu quantifizieren, haben wir verschiedene Fairness-Metriken eingeführt und zwei ausgewählt, die sich für die Definition von Fairness in unserem Beispiel eignen. Nach einem Überblick über Algorithmen zur Vermeidung von Verzerrungen gehen wir näher auf Reweighing ein: Ein Algorithmus, der auf den Daten ausgeführt wird, bevor diese als ML-Input verwendet werden. Als Anwendungsfall haben wir ein ML-Modell gewählt, das entscheidet, ob ein Bewerber zu einem Vorstellungsgespräch eingeladen wird oder nicht.
Zur Veranschaulichung des Falls wurde eine Schritt-für-Schritt-Demo mit einem Jupyter-Notebook-Skript erstellt. Die Demo zeigt, wie der Preprocessing-Reweighing-Algorithmus Verzerrungen in den Trainingsdaten und damit in den darauf basierenden Entscheidungen reduziert. Um den Abschwächungseffekt zu beziffern, haben wir das ML-Modell, das mit einem unverzerrten Datensatz trainiert wurde, mit einem Benchmark verglichen, der auf den Originaldaten basiert.
Den vollständigen Artikel (in Englisch) gibt es hier zum Download.