Schätzung der Berufserfahrung in Personal-Benchmark online

DATEV eG
DATEV TechBlog
Published in
3 min readApr 4, 2024

Jannik Kiesel & Frank Eichinger

Unser Produkt Personal-Benchmark online nutzt monatlich ca. 5 Millionen echte Gehaltsabrechnungen aus den DATEV-Lohnabrechnungsprogrammen. Es ermöglicht den Nutzenden, die Gehälter von bestehenden Mitarbeitenden sowie Bewerberinnen und Bewerbern mit einem Marktwert zu vergleichen, den wir aus den Daten ableiten. So können die Nutzenden Über- und Unterbezahlung identifizieren und marktgerechte Gehälter für Neueinstellungen finden.

Berufserfahrung ist wichtig, aber nicht bekannt

Personal-Benchmark online nutzt Künstliche Intelligenz (KI), insbesondere maschinelles Lernen, um marktgerechte Gehälter zu prognostizieren. Dabei berücksichtigen wir eine Reihe von Faktoren, darunter Beruf, Bildungsabschluss und Region (Details von unserer Voruntersuchung haben wir hier im TechBlog beschrieben und finden sich in dieser Veröffentlichung). Dabei spielt auch das Thema Anonymisierung und Datenschutz eine entscheidende Rolle (weiterer Artikel im TechBlog). Bisher wurde für die Gehaltsschätzung mittels KI auch das Alter als Parameter berücksichtigt. Arbeitnehmende verdienen aber nicht mehr, weil sie älter sind, sondern weil sie mehr Berufserfahrung haben. Gehälter vom Alter abhängig zu machen, könnte als diskriminierend angesehen werden, von der Berufserfahrung jedoch nicht. Auch bei Neueinstellungen kennt man oft das Alter noch nicht, hat jedoch eine Vorstellung davon, wie erfahren eine neue Kraft für die vorgesehenen Aufgaben sein sollte. Entsprechend haben mehrere Kunden den Wunsch geäußert, bei Gehaltsanalysen die Berufserfahrung angeben zu können. Allerdings fragen die Lohnprogramme nicht nach der Berufserfahrung, daher fehlt diese Information in den 5 Millionen Datensätzen, die wir für das maschinelle Lernen verwenden. In diesem Beitrag geht es darum, wie das dennoch möglich ist, indem wir die Berufserfahrung schätzen.

Schätzung der Berufserfahrung

Um die Berufserfahrung aus bekannten Daten wie dem höchsten Berufsabschluss und dem Alter zu schätzen, haben wir mit der Friedrich-Alexander-Universität Erlangen-Nürnberg zusammengearbeitet. Dazu haben wir im Rahmen einer Bachelorarbeit an der Universität Daten des Sozio-oekonomischen Panels (SOEP) verwendet, um verschiedene Regressionsmodelle und Verfahren des maschinellen Lernens zur Schätzung der Berufserfahrung zu trainieren und zu evaluieren. Das SOEP ist eine langlaufende Panelbefragung des Deutschen Instituts für Wirtschaftsforschung, bei der jedes Jahr rund 30.000 Personen in Deutschland unter anderem zu ihrer Erwerbsbiographie befragt werden. Entsprechend eignet sich dieser Datensatz sehr gut, soziodemografische und berufsbezogene Zusammenhänge zu analysieren. Konkret haben wir festgestellt, dass wir die besten Ergebnisse erzielen, wenn wir Alter, den höchsten Berufsabschluss und den „Berufsbereich“ der aktuellen Tätigkeit als Parameter nutzen, um die Berufserfahrung zu prognostizieren. Als bestes und gleichzeitig einfaches Modell hat sich polynomiale Regression dritten Grades herausgestellt, mit der die Berufserfahrung mit einer durchschnittlichen Abweichung von 3,65 Jahren geschätzt werden kann. Dieser vielleicht zunächst groß klingende Fehler ist darin begründet, dass unterschiedliche Arbeitnehmende ganz unterschiedliche Biographien haben, auch wenn sie gleich alt sind und den gleichen Abschluss und Beruf haben. Die Ergebnisse haben wir in der wissenschaftlichen Community diskutiert und publiziert. Die resultierenden Modelle hat die der Universität für die Allgemeinheit veröffentlicht.

Umsetzung in Personal-Benchmark online

Zuletzt fragen wir uns, ob die in unserem Modell geschätzte „Berufserfahrung“ die Marktwertprognose von Personal-Benchmark online verbessert. Oder könnte es die Ergebnisse verschlechtern, wenn wir die Schätzung anstelle des bisherigen belastbaren Feldes „Alter“ verwenden? Die gute Nachricht ist, dass sich die Ergebnisse tatsächlich minimal verbessern. Wir haben deswegen entschieden, das Feld Alter durch die Berufserfahrung zu ersetzen. Dazu schätzen wir einerseits die Berufserfahrung bei allen 5 Millionen Arbeitnehmenden, die wir für das maschinelle Lernen verwenden. Andererseits schätzen wir die Berufserfahrung ad-hoc, wenn ein Nutzender einen Mitarbeitenden für einen Gehaltsvergleich auswählt. Um Irritationen zu vermeiden, prüfen wir dabei, ob die geschätzte Berufserfahrung geringer als die Betriebszugehörigkeit ist, was in seltenen Fällen passiert. Ist das der Fall, wird die Berufserfahrung automatisch auf den Wert der Betriebszugehörigkeit gesetzt. Diese geschätzte Variable wird seit Anfang 2024 in Personal-Benchmark online bei der Gehaltsanalyse eingesetzt und wir freuen uns, eine innovative Lösung für einen Kundenwusch gefunden zu haben!

--

--

DATEV eG
DATEV TechBlog

DATEV eG steht für qualitativ hochwertige Softwarelösungen und IT-Dienstleistungen für Steuerberater, Wirtschaftsprüfer, Rechtsanwälte und Unternehmen.