CASE
Machine Learning en Big Data
2020
De opdracht
In Nederland overlijden jaarlijks zo’n 4.100 mensen aan beroepsziekten, waarvan ongeveer 2.700 aan werkgerelateerde kanker. Het ministerie Sociale Zaken en Werkgelegenheid (SZW) heeft onder meer als doel de veiligheid van Nederlandse werknemers te garanderen. Daarom is de inspectiedienst gevaarlijke stoffen ingezet om te controleren of werkgevers hun personeel voldoende beschermen.
Het probleem: Er zijn meer dan anderhalf miljoen bedrijven in Nederland werkzaam, terwijl de inspectiedienst maar een beperkt aantal personeelsleden bevat.
De vraag: Hoe kunnen we de inspecteurs op een efficiëntere manier inzetten zodat ze bedrijven met de hoogste risico’s het eerst inspecteren?

De uitwerking
Om de inspecteurs te helpen keuzes te maken over welke bedrijven toe zijn aan inspectie, hebben we voor ieder bedrijf in Nederland een risico-score berekend. Dit was geen gemakkelijke taak, aangezien dit betekende dat we data uit veel verschillende bronnen met elkaar moesten combineren. Denk aan data over giftige stoffen in de riolering per gemeente, het aantal werknemers, het type werkzaamheden, data over voorgaande inspecties, etc.
Met deze informatie werd een state-of-the-art machine learning algorithme getraind dat accuraat kon voorspellen wat het risico was voor blootstelling aan gevaarlijke stoffen. Ook werden Shapley scores berekend om te laten zien door welke manier de risicoscores werden berekend.
Het eindproduct was een interactieve app waarin inspecteurs gemakkelijk bedrijven konden zoeken die geïnspecteerd moesten worden, vergezeld van een risicoscore met een intuïtieve uitleg.