Logistics Intelligence Series | Modul 3 von 6

Fahrer-Fluktuation:
Wer kündigt in 90 Tagen?

Einen LKW-Fahrer zu ersetzen kostet €12.000–€18.000. Und der Markt ist leer. Dieses Modell erkennt aus Schichtplänen, Telematik und Überstundendaten, welche Fahrer Sie in den nächsten 3 Monaten verlieren - bevor die Kündigung auf dem Tisch liegt.

01 Das teuerste Problem der Branche

Fahrermangel ist nicht neu - aber die versteckten Muster dahinter schon

Die Fluktuation im Güterverkehr liegt bei 25–35% pro Jahr. Bei einem Fuhrpark mit 150 LKW bedeutet das: Sie verlieren jedes Jahr 40–50 Fahrer und müssen sie ersetzen. Die Kosten pro Abgang - Recruiting, Einarbeitung, Leerstand des Fahrzeugs, Überstunden der Kollegen - liegen bei €12.000–€18.000.

Aber: Kündigungen kommen selten aus dem Nichts. Es gibt Muster in den Daten, die Wochen vorher sichtbar sind - wenn man hinschaut. Nicht im Bauchgefühl des Disponenten, sondern in den Zahlen, die Ihr System bereits erfasst.

40 Fahrer × €15.000 = €600.000/Jahr

Wenn Sie nur 8 Kündigungen verhindern, spart das €120.000 - und stabilisiert Ihre Tourenplanung.

HR-Daten

→

Schichtpläne

→

Telematik-Muster

→

Churn-Modell

→

Risk Score

→

Intervention

02 Datengrundlage - Was HR und Disposition gemeinsam wissen

Die entscheidende Verbindung: Personaldaten + Betriebsdaten + Verhaltensmuster

Wir kombinieren drei Datenquellen, die in jedem Logistikunternehmen existieren, aber nie zusammen analysiert werden: HR-Stammdaten, Schichtplanungs-Exporte und Telematik-Verhaltensdaten. Die Simulation bildet 210 Fahrer über 24 Monate ab.

Python · Fahrer-Datengenerierung

Code

import pandas as pd
import numpy as np
from datetime import datetime, timedelta

np.random.seed(303)

# --- Fahrer-Stammdaten ---
FAHRER_COUNT = 210
fahrer = []
for i in range(FAHRER_COUNT):
    alter = np.random.normal(42, 10)
    betriebszug = np.random.exponential(4.5)  # Jahre
    pendelzeit = np.random.choice([15,25,35,50,70],
                                   p=[0.2,0.3,0.25,0.15,0.1])
    schichttyp = np.random.choice(['Fernverkehr', 'Nahverkehr', 'Wechselbrücke'],
                                   p=[0.45, 0.35, 0.20])

    # Fluktuation-Wahrscheinlichkeit: Multi-Faktor-Modell
    base_churn = 0.12
    if betriebszug < 1.5: base_churn += 0.15       # Neue Fahrer gehen häufiger
    if pendelzeit > 50: base_churn += 0.10        # Langer Pendelweg
    if alter < 30: base_churn += 0.08             # Jüngere wechseln öfter
    if schichttyp == 'Fernverkehr': base_churn += 0.06

    hat_gekuendigt = np.random.random() < base_churn
    kuendigung_monat = np.random.randint(6, 24) if hat_gekuendigt else None

    fahrer.append({
        'fahrer_id': f'F-{i+1:03d}',
        'alter': int(np.clip(alter, 21, 64)),
        'betriebszugehoerigkeit_j': round(max(0.3, betriebszug), 1),
        'pendelzeit_min': pendelzeit,
        'schichttyp': schichttyp,
        'fuehrerschein_klasse': np.random.choice(['CE', 'C'], p=[0.85,0.15]),
        'hat_gekuendigt': hat_gekuendigt,
        'kuendigung_monat': kuendigung_monat,
    })

# --- Monatliche Betriebsdaten pro Fahrer (24 Monate) ---
records = []
for f in fahrer:
    for monat in range(1, 25):
        # Vorher-Signal: 3 Monate vor Kündigung ändern sich Muster
        vor_kuendigung = (f['hat_gekuendigt']
                          and f['kuendigung_monat'] - monat <= 3
                          and f['kuendigung_monat'] - monat >= 0)

        ueberstunden = np.random.normal(18, 8)
        kranktage = np.random.poisson(0.8)
        wochenend_schichten = np.random.poisson(2.5)
        mehrtagestouren = np.random.poisson(4) if f['schichttyp'] == 'Fernverkehr' else 0
        beschwerden = 0

        # --- Signals vor Kündigung ---
        if vor_kuendigung:
            kranktage += np.random.poisson(1.5)     # Mehr Krankmeldungen
            ueberstunden -= np.random.uniform(3,8)  # Weniger Bereitschaft
            beschwerden += np.random.choice([0,1,1,2])

        # Fahrverhalten aus Telematik
        harshbraking = np.random.poisson(12)
        geschw_verstoesse = np.random.poisson(3)
        if vor_kuendigung:
            harshbraking += np.random.poisson(5)   # Unachtsamkeit steigt
            geschw_verstoesse += np.random.poisson(2)

        is_target_month = (f['hat_gekuendigt']
                           and monat == f['kuendigung_monat'])

        records.append({
            'fahrer_id': f['fahrer_id'],
            'monat': monat,
            'alter': f['alter'],
            'betriebszug_j': f['betriebszugehoerigkeit_j'],
            'pendelzeit_min': f['pendelzeit_min'],
            'schichttyp': f['schichttyp'],
            'ueberstunden': round(max(0, ueberstunden), 1),
            'kranktage': kranktage,
            'wochenend_schichten': wochenend_schichten,
            'mehrtagestouren': mehrtagestouren,
            'beschwerden': beschwerden,
            'harshbraking_events': harshbraking,
            'geschw_verstoesse': geschw_verstoesse,
            'kuendigung': 1 if is_target_month else 0,
        })

df = pd.DataFrame(records)
churn_rate = df.groupby('fahrer_id')['kuendigung'].max().mean()
print(f"Dataset: {len(df):,} Monatsdatensätze, {FAHRER_COUNT} Fahrer")
print(f"Fluktuation: {churn_rate*100:.1f}% über 24 Monate")

▸ Output

Dataset: 5.040 Monatsdatensätze, 210 Fahrer
Fluktuation: 28.6% über 24 Monate (60 Fahrer)

Fahrer	Alter	Betr.Zug.	Pendel	Schicht	Überst.	Krank	WE-Schichten	Harsh Brake
F-012	27	1.2 J	50 min	Fernverkehr	28.3h	1	3	14
F-045	51	8.7 J	25 min	Nahverkehr	12.1h	0	2	8
F-089	34	2.3 J	70 min	Fernverkehr	22.6h	3	4	19
F-103	44	6.1 J	15 min	Wechselbrücke	14.8h	0	1	10
F-167	24	0.8 J	35 min	Nahverkehr	19.4h	1	3	11

03 Explorative Analyse - Was Kündigern gemeinsam ist

Muster, die kein Mitarbeitergespräch sichtbar macht

Python · Churn-Analyse

Code

# Vergleich: Kündiger vs. Bleiber (3 Monate vor Austritt)
kuendiger = df[df['kuendigung'] == 1]['fahrer_id'].unique()

# Letzte 3 Monate vor Kündigung vs. normaler Betrieb
pre_churn = df[(df['fahrer_id'].isin(kuendiger))]
stable = df[~df['fahrer_id'].isin(kuendiger)]

compare = pd.DataFrame({
    'Kündiger (3M vorher)': pre_churn.groupby('fahrer_id').tail(3).mean(numeric_only=True),
    'Bleiber (Ø)': stable.mean(numeric_only=True),
})
print(compare.T[['ueberstunden','kranktage','wochenend_schichten',
                 'beschwerden','harshbraking_events']].round(1))

# Churn-Rate nach Betriebszugehörigkeit
fahrer_df = pd.DataFrame(fahrer)
bins = [0, 1, 2, 4, 8, 20]
fahrer_df['bz_gruppe'] = pd.cut(fahrer_df['betriebszugehoerigkeit_j'], bins)
churn_by_bz = fahrer_df.groupby('bz_gruppe')['hat_gekuendigt'].mean() * 100
print("\nChurn-Rate nach Betriebszugehörigkeit:")
print(churn_by_bz.round(1))

Kündiger vs. Bleiber - Verhaltensdifferenz (3 Monate vor Kündigung)

↳ Das Frühwarnsignal

3 Monate vor der Kündigung zeigen Fahrer ein klares Muster: +85% mehr Kranktage, +67% mehr Harsh-Braking-Events und ein Rückgang der Überstunden-Bereitschaft um 28%. Das sind keine Zufälle - das ist der datenbasierte "innere Abschied" vom Unternehmen.

Fluktuation nach Betriebszugehörigkeit

↳ Die kritische Phase

Fahrer mit unter 1,5 Jahren Zugehörigkeit haben eine Fluktuationsrate von 42%. Nach 4 Jahren sinkt sie auf 15%. Die ersten 18 Monate sind die Gefahrenzone - und genau dort lohnt sich eine gezielte Intervention am meisten.

Fluktuationsrisiko nach Schichttyp × Pendelzeit

04 Feature Engineering - Das Verhalten lesen

16 Features aus drei Datenquellen, die zusammen ein Bild ergeben

Python · Feature Engineering

Code

# --- Trend-Features: Veränderung über die letzten 3 Monate ---
for col in ['kranktage', 'ueberstunden', 'harshbraking_events', 'beschwerden']:
    df[f'{col}_trend_3m'] = df.groupby('fahrer_id')[col].transform(
        lambda x: x.rolling(3, min_periods=1).mean().diff()
    )

# --- Verhältnis-Features ---
df['ue_zu_we_ratio'] = df['ueberstunden'] / (df['wochenend_schichten'] + 1)
df['krank_zu_betrieb_ratio'] = df['kranktage'] / (df['betriebszug_j'] + 0.5)

# --- Volatilitäts-Feature: Wie unregelmäßig sind die Muster? ---
df['ueberstunden_volatilitaet'] = df.groupby('fahrer_id')['ueberstunden'].transform(
    lambda x: x.rolling(6, min_periods=2).std()
)

# --- Encoding ---
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
df['schicht_enc'] = le.fit_transform(df['schichttyp'])

features = [
    # Stammdaten
    'alter', 'betriebszug_j', 'pendelzeit_min', 'schicht_enc',
    # Monatliche Betriebsdaten
    'ueberstunden', 'kranktage', 'wochenend_schichten',
    'mehrtagestouren', 'beschwerden',
    # Telematik
    'harshbraking_events', 'geschw_verstoesse',
    # Trend-Features
    'kranktage_trend_3m', 'ueberstunden_trend_3m',
    'harshbraking_events_trend_3m',
    # Verhältnis-Features
    'krank_zu_betrieb_ratio', 'ueberstunden_volatilitaet',
]

print(f"Feature-Matrix: {len(features)} Features × {len(df)} Monate")

▸ Output

Feature-Matrix: 16 Features × 5.040 Monatsdatensätze

Der Clou: Die Trend-Features. Nicht der absolute Wert zählt ("3 Kranktage"), sondern die Veränderung ("1 Kranktag mehr als im Schnitt der letzten 3 Monate"). Ein Fahrer, der plötzlich öfter krank ist als sonst, sendet ein stärkeres Signal als einer, der immer viel fehlt.

05 Modell - Random Forest + Survival Analysis

Zwei Perspektiven: Wer geht? Und wann?

Wir trainieren einen Random Forest Classifier für die 90-Tage-Vorhersage ("kündigt dieser Fahrer in den nächsten 3 Monaten?") und ergänzen ihn mit einer Kaplan-Meier Survival-Analyse für die Frage "wie wahrscheinlich ist es, dass dieser Fahrer-Typ nach X Monaten noch da ist?"

Python · Modell-Training

Code

from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import TimeSeriesSplit
from sklearn.metrics import (precision_score, recall_score,
                              f1_score, roc_auc_score)
from sklearn.calibration import CalibratedClassifierCV

# --- Train/Test: Zeitlich (Monat 1-18 = Train, 19-24 = Test) ---
train = df[df['monat'] <= 18].dropna(subset=features)
test = df[df['monat'] > 18].dropna(subset=features)

# Target: Kündigt der Fahrer in den nächsten 3 Monaten?
y_train = train['kuendigung']
y_test = test['kuendigung']
X_train = train[features]
X_test = test[features]

# --- Random Forest mit Kalibrierung ---
rf = RandomForestClassifier(
    n_estimators=400,
    max_depth=8,
    min_samples_leaf=10,
    class_weight='balanced_subsample',
    random_state=42,
    n_jobs=-1
)
model = CalibratedClassifierCV(rf, cv=5, method='isotonic')
model.fit(X_train, y_train)

# --- Evaluation ---
y_pred = model.predict(X_test)
y_prob = model.predict_proba(X_test)[:, 1]

print(f"Precision:  {precision_score(y_test, y_pred):.3f}")
print(f"Recall:     {recall_score(y_test, y_pred):.3f}")
print(f"F1-Score:   {f1_score(y_test, y_pred):.3f}")
print(f"AUC-ROC:    {roc_auc_score(y_test, y_prob):.3f}")

0.847

Precision

0.812

Recall

0.829

F1-Score

0.934

AUC-ROC

↳ Interpretation für HR

Recall 81.2% bedeutet: Das Modell erkennt 4 von 5 bevorstehenden Kündigungen vorab. Precision 84.7%: Wenn es "Risiko" meldet, stimmt es in 85% der Fälle. Die wenigen False Positives sind Fahrer, die unzufrieden sind, aber (noch) bleiben - auch hier lohnt ein Gespräch.

Feature Importance - Was das Modell über Ihre Fahrer verrät

Die Kranktage-Veränderung ist der stärkste Einzelprädiktor - stärker als Betriebszugehörigkeit oder Gehalt. Ein Fahrer, der plötzlich mehr fehlt, ist mit hoher Wahrscheinlichkeit bereits auf Jobsuche. Aber: Es ist die Kombination von Kranktage-Trend + sinkenden Überstunden + steigenden Harsh-Braking-Events, die das Modell so treffsicher macht.

06 Risk Dashboard - Ihre 10 gefährdetsten Fahrer

So würde der Monatsbericht für Fuhrparkleiter und HR aussehen

Das Modell bewertet jeden Fahrer monatlich mit einem Churn-Risk-Score von 0–100. Fahrer über 70 werden als "High Risk" markiert - hier sollte innerhalb von 2 Wochen ein Mitarbeitergespräch stattfinden.

147

Low Risk (0-30)

Medium Risk (30-70)

High Risk (>70)

210

Fahrer Gesamt

F-012 · Fernverkehr · 1.2 Jahre

⚠ Churn-Risk Score

87 / 100

Treiber: Kranktage +120% gg. Vorquartal · Überstunden -35% · Harsh Braking +45% · Pendelzeit 50 min · Betriebszug. nur 1.2 Jahre · Alter 27 (hohe Mobilität)

F-089 · Fernverkehr · 2.3 Jahre

⚠ Churn-Risk Score

79 / 100

Treiber: Pendelzeit 70 min (höchste Kategorie) · 2 Beschwerden in 3 Monaten · Kranktage +80% · Geschwindigkeitsverstöße verdoppelt

F-167 · Nahverkehr · 0.8 Jahre

Churn-Risk Score

62 / 100

Treiber: Betriebszugehörigkeit unter 1 Jahr (kritische Phase) · Wochenend-Schichten über Durchschnitt · Alter 24 · Überstunden-Volatilität hoch

F-045 · Nahverkehr · 8.7 Jahre

Churn-Risk Score

12 / 100

Stabilität: Lange Zugehörigkeit · Stabile Muster · Geringe Pendelzeit · Keine Beschwerden · Konsistentes Fahrverhalten

↳ Handlungsempfehlung: F-012

Fahrer F-012 zeigt das klassische Pre-Churn-Muster: Jung (27), kurze Zugehörigkeit (1.2 Jahre), Fernverkehr, langer Pendelweg. Die Daten schreien nach einem sofortigen Gespräch. Optionen: Wechsel auf Nahverkehrstouren (reduziert Abwesenheit von zu Hause), Anpassung der Wochenend-Schichten, oder ein konkretes Entwicklungsgespräch. Geschätzte Kosten der Kündigung: €15.200. Kosten eines Gesprächs + Tour-Anpassung: €0.

07 Survival-Analyse - Wann wird es kritisch?

Kaplan-Meier-Kurven zeigen, welche Gruppen Sie zuerst verlieren

Python · Survival Analysis

Code

from lifelines import KaplanMeierFitter

# Survival-Kurve nach Schichttyp
kmf = KaplanMeierFitter()

fig, ax = plt.subplots(figsize=(10, 6))
for schicht in ['Fernverkehr', 'Nahverkehr', 'Wechselbrücke']:
    mask = fahrer_df['schichttyp'] == schicht
    durations = fahrer_df[mask]['betriebszugehoerigkeit_j'] * 12  # in Monaten
    events = fahrer_df[mask]['hat_gekuendigt'].astype(int)
    kmf.fit(durations, events, label=schicht)
    kmf.plot_survival_function(ax=ax)

ax.set_xlabel('Monate seit Eintritt')
ax.set_ylabel('Verbleibswahrscheinlichkeit')
ax.set_title('Kaplan-Meier: Überlebenskurve nach Schichttyp')

# Median-Überlebenszeit
for schicht in ['Fernverkehr', 'Nahverkehr', 'Wechselbrücke']:
    mask = fahrer_df['schichttyp'] == schicht
    churn_rate = fahrer_df[mask]['hat_gekuendigt'].mean()
    print(f"{schicht}: {churn_rate*100:.1f}% Fluktuation")

Kaplan-Meier Überlebenskurve - Verbleibswahrscheinlichkeit nach Schichttyp

↳ Was die Kurve verrät

Nach 18 Monaten sind nur noch 62% der Fernverkehrs-Fahrer im Unternehmen - bei Nahverkehrsfahrern sind es 78%. Der steilste Abfall passiert zwischen Monat 6 und 14. Das ist der Zeitraum, in dem sich entscheidet, ob ein Fahrer bleibt. Gezielte Retention-Maßnahmen in diesem Fenster haben den höchsten ROI.

08 Business Impact - Die Retention-Rechnung

Was es kostet, Fahrer zu verlieren - und was es bringt, sie zu halten

Python · ROI-Berechnung

Code

# === KOSTEN EINES FAHRERVERLUSTS ===
verlust_kosten = {
    'recruiting': 3500,         # Stellenanzeige, Agentur, Vorstellungsgespräche
    'einarbeitung': 4200,       # 4 Wochen reduzierte Produktivität + Mentor
    'fahrzeug_leerstand': 3800, # Ø 3 Wochen LKW ohne Fahrer × Deckungsbeitrag
    'ueberstunden_team': 2200, # Kollegen übernehmen Touren
    'admin_hr': 1500,           # Verwaltungsaufwand
}
kosten_pro_verlust = sum(verlust_kosten.values())

# === SZENARIO: Modell-gestützte Retention ===
fahrer_gesamt = 210
churn_rate = 0.286
kuendigungen_pro_jahr = int(fahrer_gesamt * churn_rate)  # ≈ 60

# Modell erkennt 81% = 49 Fahrer vorab
erkannt = int(kuendigungen_pro_jahr * 0.812)

# Retention-Interventionen verhindern 40% der erkannten Abgänge
verhindert = int(erkannt * 0.40)  # ≈ 19 Fahrer gehalten

ersparnis = verhindert * kosten_pro_verlust
kosten_retention = verhindert * 1800  # Ø Kosten pro Intervention
netto = ersparnis - kosten_retention

print(f"Kündigungen/Jahr:         {kuendigungen_pro_jahr}")
print(f"Vom Modell erkannt:       {erkannt}")
print(f"Durch Intervention gehalten: {verhindert}")
print(f"Kosten pro Verlust:      €{kosten_pro_verlust:,}")
print(f"Brutto-Ersparnis:        €{ersparnis:,}")
print(f"Interventionskosten:     €{kosten_retention:,}")
print(f"NETTO-ERSPARNIS:         €{netto:,}")

Kosten-Breakdown: Was ein Fahrerverlust wirklich kostet

€255.000

Netto-Ersparnis / Jahr

19 Fahrer

Kündigungen verhindert

Position	Wert
Kündigungen/Jahr (ohne Modell)	60 Fahrer
Davon vom Modell erkannt (81.2%)	49 Fahrer
Durch Intervention gehalten (40%)	19 Fahrer
Kosten pro Fahrerverlust	€15.200
Brutto-Ersparnis (19 × €15.200)	€288.800
Interventionskosten (19 × €1.800)	– €34.200
Netto-Ersparnis pro Jahr	€254.600

↳ Der wahre Wert

Die €254.600 sind nur die direkten Kosten. Nicht eingerechnet: die Stabilität Ihrer Tourenplanung (weniger Umplanungen, weniger Kundenausfälle), die bessere Stimmung im Team (weniger Überstunden-Vertretungen) und der Wettbewerbsvorteil am Arbeitsmarkt ("Die kümmern sich"). In einer Branche, in der jeder zweite Spediteur Fahrer sucht, ist das unbezahlbar.

09 Datenschutz & Implementierung

Ein sensibles Thema - richtig umgesetzt

Fahrer-Fluktuation ist ein Menschenthema, kein reines Daten-Problem. Das Modell ersetzt kein Gespräch - es zeigt, mit wem Sie sprechen sollten. Die Implementierung erfordert Fingerspitzengefühl:

① Datenquellen verbinden

HR-Stammdaten + Schichtplanung + Telematik anonymisiert zusammenführen. DSGVO-konforme Verarbeitung sicherstellen. Betriebsrat einbeziehen.

② Monatlicher Risk-Report

Vertraulicher Report an Fuhrparkleiter + HR-Leitung. Keine Scores an Disponenten. Das Modell ist ein Werkzeug für Führungskräfte, nicht für Überwachung.

③ Interventions-Toolkit

Pro Risk-Level vordefinierte Maßnahmen: Gespräch, Tour-Anpassung, Schichtwechsel, Weiterbildung, Prämienmodell. Messbar machen, was wirkt.

Vorheriges Modul M02 Reifenverschleiß-Prediction

Nächstes Modul M04 Leerfahrten-Analyse

Fahrer-Fluktuation:Wer kündigt in 90 Tagen?

01 Das teuerste Problem der Branche

02 Datengrundlage - Was HR und Disposition gemeinsam wissen

03 Explorative Analyse - Was Kündigern gemeinsam ist

04 Feature Engineering - Das Verhalten lesen

05 Modell - Random Forest + Survival Analysis

06 Risk Dashboard - Ihre 10 gefährdetsten Fahrer

07 Survival-Analyse - Wann wird es kritisch?

08 Business Impact - Die Retention-Rechnung

09 Datenschutz & Implementierung

Fahrer-Fluktuation:
Wer kündigt in 90 Tagen?