Reform Index der Bertelsmann Stiftung

Arbeitsmarktanalyse mit Hilfe von Online-Stellenanzeigen: Stärken, Schwächen, Herausforderungen und Chancen

Zunehmend werden Online-Stellenanzeigen genutzt, um Erkenntnisse über den Arbeitsmarkt zu gewinnen. Denn innovative Datenverarbeitungsmethoden ermöglichen es, das Potenzial großer Mengen Textdaten zu erschließen. Dies birgt jedoch methodische und statistische Herausforderungen.

Inhalt

Verbesserte Datenanalysenwerkzeuge und ein einfacherer Zugang dazu erleichtern heute die Extraktion von Informationen aus Textkörpern, gleichzeitig werden online zunehmend Stellenanzeigen (Online Job Advertisements – OJA) veröffentlicht. Dies erschließt eine neue Quelle an Informationen über Entwicklungen auf dem Arbeitsmarkt.

Bevor jedoch Schlussfolgerungen auf der Grundlage einer Analyse von OJAs gezogen werden können, müssen Aspekte der Erhebung, Verarbeitung und Nutzung berücksichtigt werden. Ziel dieses Artikels ist es daher, einige wichtige Stärken, Schwächen, Herausforderungen und Chancen von Online-Stellenanzeigen aufzuzeigen und herauszuarbeiten, was Forscher:innen beachten müssen, wenn sie diese Art von Daten als Informationsquelle nutzen möchten.

Stärken

OJAs können nützlich sein, um Entwicklungen auf dem Arbeitsmarkt zu identifizieren. Dies hat vor allem zwei Gründe: Online-Stellenanzeigen werden vermehrt genutzt, so dass eine große Datenbasis für Analysen zur Verfügung steht. Außerdem können die Daten schon kurz nach der Veröffentlichung gesammelt und analysiert werden. Auf diesem Weg gesammelte Daten stehen somit erheblich früher zu Verfügung als Daten, welche auf bisherigen Wegen gesammelt werden.

Diese Vorteile ermöglichen Folgendes:

1. Erkennen von Veränderungen im Einstellungsverhalten aufgrund von Arbeitsmarkttrends

Online-Stellenanzeigen können Aufschluss darüber geben, bei welchen Stellen Arbeitgeber Schwierigkeiten haben, interne oder informelle Rekrutierungskanäle erfolgreich zu verwenden. Eine Verknappung des Arbeitskräfteangebots lässt sich beispielsweise feststellen, wenn Unternehmen damit beginnen, Stellen auf vielen verschiedenen Job-Websites oder auf ausländischen Stellenanzeigenplattformen auszuschreiben (z. B. aufgrund der angespannten Lage auf dem lokalen Arbeitsmarkt im Herkunftsland), oder durch einen Vergleich der Stellenanzeigenstatistik mit der Beschäftigungsstatistik.

2. Erkennen von Trends bei Stellenanforderungen und -bedingungen

Mit OJAs lassen sich nicht nur Qualifikationen identifizieren, die im Laufe der Zeit aufgetaucht (z. B. Blockchain-Programmierung) oder verschwunden sind (z. B. Disketten-Datenmanagement), sondern auch Unterschiede in den Arbeitsanforderungen und -bedingungen (z. B. eine Zunahme von Homeoffice) im Laufe der Zeit, in Regionen, Branchen, Berufen, unterschiedlichen Unternehmensformen, et cetera.

3. Identifizierung von Branding-Strategien der Unternehmen

Anhand der Formulierungen, mit denen Unternehmen sich selbst oder ihr Arbeitsumfeld beschreiben, können OJAs auch Aufschluss über die Branding-Strategien von Unternehmen geben.

Schwächen

OJAs bieten kein vollständiges Bild der Arbeitsplatzanforderungen und des Arbeitsmarktes. Dafür gibt es mehrere Gründe:

Viele freie Stellen werden nicht online veröffentlicht. Dies führt zu Repräsentativitätsproblemen, da bestimmte Branchen und Berufsgruppen Online-Stellenportale mehr beziehungsweise weniger nutzen als andere, oder weil unterschiedliche Senioritätsstufen und Berufsgruppen unterschiedliche Einstellungsstrategien erfordern (z. B. Headhunting, Netzwerke). Da es für OJA-Daten keine Grundwahrheit gibt (d. h. wir kennen die tatsächliche Verteilung der Stellendaten über eine bestimmte Variable nicht), bleiben Aussagen über die Repräsentativität jedes OJA-Datensatzes begrenzt.

Informationen fehlen in OJAs auch aufgrund von impliziten Anforderungen (Fähigkeiten, die offensichtlich benötigt werden und daher nicht einmal erwähnt werden), Wettbewerbsstrategien (z. B. Verheimlichung der eigenen Aktivitäten vor den Mitbewerbern) und Einstellungsstrategien (z. B. Signalisierung von Absichten zu Branding-Zwecken oder sogar Vortäuschung eines Anstiegs offener Stellen, um ein Geschäftswachstum zu suggerieren).

Die Informationen in Online-Stellenanzeigen geben in erster Linie wieder, was die Unternehmen für wichtig halten, um geeignete Bewerber:innen anzuziehen. Sie dienen jedoch nicht unbedingt dazu, den Bewerber:inen ein vollständiges Verständnis über die Anforderungen und Aufgaben der Stelle zu vermitteln.

Herausforderungen

Die Arbeit mit OJV ist nicht ohne Herausforderungen.

1. Schwierigkeiten bei der Datenerfassung, -bereinigung und -verarbeitung

Schwierigkeiten bei der Datenerfassung: Es gibt drei verschiedene Möglichkeiten, Informationen aus Webseiten zu extrahieren. In der Regel in bevorzugter Reihenfolge:

a) Direkter Zugang (auch "API-Zugang" genannt), was im Wesentlichen bedeutet, dass man Zugang zur Datenbank der Website hat. Dies erfordert in der Regel eine formale Vereinbarung mit dem Website-Anbieter.

b) Scraping, d.h. die Extraktion nur relevanter strukturierter Daten aus Webseiten

c) Crawling, d.h. das Durchsuchen und Herunterladen ganzer Webseiten, und dann die Anwendung von Algorithmen zum "Lesen" und Verstehen der darin enthaltenen Informationen.

Die Anwendung unterschiedlicher Methoden auf verschiedenen Websites führt zu sehr unterschiedlichen Ergebnissen und damit zu Schwierigkeiten bei der Informationsextraktion.

Schwierigkeiten bei der (De-)Duplizierung und Zusammenführung:

Stellenanzeigen für eine einzige offene Stelle werden in der Regel über mehrere Plattformen veröffentlicht. Diese Stellenanzeigen können zu unterschiedlichen Zeitpunkten veröffentlicht werden und geringfügige Änderungen im Text enthalten, was zu widersprüchlichen Informationen in den Stellenanzeigen für dieselbe Position führen kann. Eine einzige Stellenanzeige kann auch dazu dienen, mehrere offene Stellen zu bewerben. Daher können unterschiedliche Methoden zur Zusammenführung und Priorisierung von Informationen während des Deduplizierungsprozesses zu sehr unterschiedlichen Ergebnissen führen.

Scraping- und Textverarbeitungsfehler:

Mitunter können auf Websites die Texte der Stellenanzeigen nicht korrekt identifiziert werden. Sie können mit anderen Texten auf der Website oder anderen Stellenanzeigen verwechselt werden.

Außerdem gibt es noch das Problem, dass für unterschiedliche Website-Strukturen auch unterschiedliche Scraper entwickelt werden müssen, die alle über die gleiche Qualität verfügen sollten.

Schwierigkeiten bei der Identifizierung von Bedeutungen und Kontexten:

Die im Text enthaltenen Informationen müssen mit Hilfe von Algorithmen extrahiert und korrekt kategorisiert werden z. B. müssen die OJAs einer Branche zugeordnet oder die vom Bewerber geforderten Kompetenzen extrahiert werden. Besonders herausfordernd ist dies bei Aussagen und Bezeichnungen, die unterschiedliche Bedeutungen, aber ähnliche Strukturen aufweisen.

2. Unterschiede in der Offenlegung von Informationen, der Namensgebung und den Sprachkonventionen

Offenlegung von Informationen:

Stellenanzeigen enthalten vielfältige Informationen. Insbesondere geben sie Auskunft über die Anforderungen, die an den Bewerber gestellt werden, die potentiellen Aufgaben und Auskunft über das Unternehmen. Menge und Art der angegebenen Informationen variieren stark zwischen den einzelnen OJAs. So enthalten einzelne z. B. Angaben zum Gehalt während andere dies gar nicht erwähnen. Diese Unterschiede erschweren eine aussagekräftige Extraktion der Informationen.

Namensgebung:  Weitere Probleme können bei der Namensgebung auftretend, da es keine allgemein verwendete Definition von Berufsbezeichnungen gibt.

Sprache: Darüber hinaus können noch übersetzungsbedingte Probleme auftreten, auch bedingt durch unterschiedliche Schriftsysteme.

Möglichkeiten

OJAs als Datenquelle werden aussagekräftiger, wenn sie in einen umfassenderen Zusammenhang gestellt werden, z.B. mit Daten über aktuelle Wirtschaftstätigkeiten der Unternehmen oder Arbeitsmarktstatistiken. Der Vergleich von OJA-Daten mit Daten der amtlichen Beschäftigungsstatistik kann dazu beitragen, Verzerrungen und Probleme bei der Datenerfassung aufzudecken.

Darüber hinaus sind spannende Erkenntnisse zu erwarten, wenn Daten aus Online-Stellenanzeigen in Kombination mit anderen Daten interpretiert werden. So könnten in Lebensläufen enthaltene Informationen dazu beitragen, die Diskrepanz zwischen angebotenen und gesuchten Kompetenzen aufzeigen.  

Zusammenfassend lässt sich sagen, dass die Nutzung großer Mengen von Online-Stellenanzeigen als Informationsquelle für Entwicklungen auf dem Arbeitsmarkt durchaus Vorteile bietet. Diese Art von Daten hat jedoch auch einige Schwächen, die sorgfältig bedacht, und Herausforderungen, die überwunden werden müssen, um sicherzustellen, dass die Daten von guter Qualität sind und zuverlässige Erkenntnisse liefern können. Die Arbeit an Qualitätsstandards und die Weiterentwicklung von Methoden zur Verarbeitung und Analyse von OJAs sind daher wichtig, um besser zu verstehen, wie Forscher:innen mit Hilfe solcher Daten relevante Informationen über den Arbeitsmarkt erlangen können.