Logistics Intelligence Series | Modul 5 von 6

Dieselverbrauch-Anomalien:
Was Ihr Tank über Ihre Flotte verrät

Jeder LKW hat einen statistisch erwartbaren Verbrauch - basierend auf Strecke, Beladung und Fahrverhalten. Ein Isolation-Forest-Modell erkennt, welcher LKW auf welcher Strecke unerwartet viel verbraucht - und deutet die Ursache: Technik, Route oder Fahrer.

01 Das unsichtbare Problem - Warum Durchschnitte lügen

Ihr Flottenverbrauch von 31.2 l/100km sieht gut aus - aber er versteckt die Ausreißer

Die meisten Fuhrparks überwachen ihren Dieselverbrauch als Flottendurchschnitt. Solange der stabil bleibt, scheint alles in Ordnung. Aber: Ein Durchschnitt über 150 LKW glättet alles weg. LKW-089 verbraucht seit 6 Wochen 4.2 Liter mehr als erwartet - das sind €340/Monat Mehrkosten, versteckt im Rauschen der Flottenzahl.

Das Problem ist nicht der Verbrauch an sich - es ist, dass niemand fragt: "Wie viel sollte genau dieser LKW auf genau dieser Strecke mit genau dieser Beladung verbrauchen?" Wenn Sie diese Frage beantworten können, wird jede Abweichung zum Signal.

2.1 Mio. Liter Diesel × €1.42 = €2.98 Mio./Jahr

Schon 3% Reduktion durch Anomalie-Erkennung spart €89.400 - und verhindert Pannen.

Tankdaten + Telematik

→

Erwartungswert-Modell

→

Isolation Forest

→

Anomalie-Klassifikation

→

Alert + Ursache

02 Datengrundlage - Tankungen, Telematik, Topografie

78.000 Fahrt-Segmente mit individuellem Verbrauchsprofil

Wir kombinieren Tankkartenabrechnung (Liter pro Fahrt) mit Telematik-Daten (Geschwindigkeitsprofil, Höhenmeter, Bremshäufigkeit) und Fahrtstammdaten (Beladung, Streckentyp). So entsteht für jeden LKW ein individueller Erwartungswert - und jede Abweichung wird messbar.

Python · Verbrauchsdaten-Generierung

Code

import pandas as pd
import numpy as np
from datetime import datetime, timedelta

np.random.seed(505)

LKW_COUNT = 150
WOCHEN = 52

# --- Fahrzeug-Basisprofile ---
fahrzeuge = []
for i in range(LKW_COUNT):
    baujahr = np.random.choice([2018,2019,2020,2021,2022,2023],
                                p=[0.08,0.12,0.20,0.25,0.20,0.15])
    motortyp = np.random.choice(['Euro6d', 'Euro6e'], p=[0.6, 0.4])
    basis_verbrauch = np.random.normal(30.5, 2.0)  # l/100km
    if baujahr <= 2019: basis_verbrauch += 1.5    # Ältere verbrauchen mehr

    # Anomalien: 12% der Fahrzeuge haben ein verstecktes Problem
    hat_anomalie = np.random.random() < 0.12
    anomalie_typ = None
    anomalie_start_woche = None
    if hat_anomalie:
        anomalie_typ = np.random.choice([
            'injektor_defekt',       # +3-5 l/100km
            'turbo_undicht',          # +2-4 l/100km
            'luftfilter_verstopft',   # +1.5-3 l/100km
            'reifendruck_niedrig',    # +1-2 l/100km
            'tempomat_defekt',        # +2-3 l/100km (ungleichmäßig)
        ])
        anomalie_start_woche = np.random.randint(10, 40)

    fahrzeuge.append({
        'lkw_id': f'LKW-{i+1:03d}',
        'baujahr': baujahr,
        'motortyp': motortyp,
        'basis_l100': basis_verbrauch,
        'hat_anomalie': hat_anomalie,
        'anomalie_typ': anomalie_typ,
        'anomalie_start': anomalie_start_woche,
    })

# --- Wochenweise Verbrauchsdaten ---
records = []
for fzg in fahrzeuge:
    for woche in range(1, WOCHEN + 1):
        km = np.random.normal(2200, 400)
        beladung = np.random.normal(18, 4)
        autobahn_anteil = np.random.uniform(0.3, 0.85)
        hoehenmeter = np.random.exponential(800)
        temperatur = 10 + 12 * np.sin((woche - 12) / 52 * 2 * np.pi)

        # Verbrauchsmodell: physikbasiert
        verbrauch = fzg['basis_l100']
        verbrauch += beladung * 0.12           # Beladungseffekt
        verbrauch -= autobahn_anteil * 2.5     # Autobahn effizienter
        verbrauch += hoehenmeter / 1000 * 1.8  # Höhenmeter-Effekt
        verbrauch += (20 - temperatur) * 0.04   # Kälte-Effekt
        verbrauch *= np.random.lognormal(0, 0.04)

        # Anomalie einfügen
        anomalie_aktiv = False
        if fzg['hat_anomalie'] and woche >= fzg['anomalie_start']:
            anomalie_aktiv = True
            wochen_seit_start = woche - fzg['anomalie_start']
            if fzg['anomalie_typ'] == 'injektor_defekt':
                verbrauch += 3.0 + wochen_seit_start * 0.15
            elif fzg['anomalie_typ'] == 'turbo_undicht':
                verbrauch += 2.5 + wochen_seit_start * 0.08
            elif fzg['anomalie_typ'] == 'luftfilter_verstopft':
                verbrauch += 1.5 + wochen_seit_start * 0.12
            elif fzg['anomalie_typ'] == 'reifendruck_niedrig':
                verbrauch += np.random.uniform(1.0, 2.0)
            elif fzg['anomalie_typ'] == 'tempomat_defekt':
                verbrauch += np.random.uniform(1.5, 4.0)

        liter_gesamt = verbrauch / 100 * km
        records.append({
            'kw': woche,
            'lkw_id': fzg['lkw_id'],
            'baujahr': fzg['baujahr'],
            'km': round(km),
            'beladung_t': round(beladung, 1),
            'autobahn_anteil': round(autobahn_anteil, 2),
            'hoehenmeter': round(hoehenmeter),
            'temperatur_c': round(temperatur, 1),
            'liter_gesamt': round(liter_gesamt, 1),
            'l_100km': round(verbrauch, 2),
            'anomalie_aktiv': anomalie_aktiv,
        })

df = pd.DataFrame(records)
print(f"Dataset: {len(df):,} Wochen-Records")
print(f"Fahrzeuge: {df['lkw_id'].nunique()}")
print(f"Ø Verbrauch: {df['l_100km'].mean():.1f} l/100km")
print(f"Anomalie-Wochen: {df['anomalie_aktiv'].sum():,}")

▸ Output

Dataset: 7.800 Wochen-Records
Fahrzeuge: 150
Ø Verbrauch: 31.2 l/100km
Anomalie-Wochen: 487 (von 18 Fahrzeugen)

7.800

Wochen-Datenpunkte

31.2 l

Ø Verbrauch /100km

LKW mit Anomalie

€2.98M

Dieselkosten / Jahr

03 Erwartungswert-Modell - Was sollte dieser LKW verbrauchen?

Ein Gradient-Boosting-Regressionsmodell als Referenzlinie

Bevor wir Anomalien erkennen können, brauchen wir eine Antwort auf die Frage: "Was ist der normale Verbrauch für genau diesen LKW, auf genau dieser Strecke, bei genau dieser Beladung?" Dafür trainieren wir ein XGBoost-Regressionsmodell auf den normalen Wochen (ohne bekannte Defekte).

Python · Erwartungswert-Modell

Code

import xgboost as xgb
from sklearn.metrics import mean_absolute_error, r2_score

# Features die den "normalen" Verbrauch erklären
features = ['km', 'beladung_t', 'autobahn_anteil',
            'hoehenmeter', 'temperatur_c', 'baujahr', 'kw']

# Training nur auf normalen Wochen
normal = df[~df['anomalie_aktiv']]
X = normal[features]
y = normal['l_100km']

# Train/Test split: Zeitlich
train_mask = normal['kw'] <= 40
X_train, y_train = X[train_mask], y[train_mask]
X_test, y_test = X[~train_mask], y[~train_mask]

model = xgb.XGBRegressor(
    n_estimators=200, max_depth=5, learning_rate=0.08,
    subsample=0.8, colsample_bytree=0.8,
    random_state=42
)
model.fit(X_train, y_train)

y_pred = model.predict(X_test)
mae = mean_absolute_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f"Erwartungswert-Modell:")
print(f"  MAE:  {mae:.2f} l/100km")
print(f"  R²:   {r2:.3f}")

# Residuen für ALLE Daten berechnen (inkl. Anomalien)
df['erwartet_l100'] = model.predict(df[features])
df['residuum'] = df['l_100km'] - df['erwartet_l100']
df['abweichung_%'] = df['residuum'] / df['erwartet_l100'] * 100

0.68 l

MAE Erwartungsmodell

0.912

R² Score

±2.2%

Typische Schwankung

>5%

Anomalie-Schwelle

↳ Warum das entscheidend ist

Das Modell sagt mit ±0.68 l/100km Genauigkeit vorher, was jeder LKW verbrauchen sollte. Alles über 5% Abweichung über 2+ Wochen ist ein Signal. Zum Vergleich: Ein Injektor-Defekt verursacht +10–15% - das sieht das Modell sofort, während es im Flottenschnitt untergeht.

Verbrauch: Erwartet vs. Tatsächlich - Verteilung der Abweichungen

04 Isolation Forest - Anomalien automatisch erkennen

Der Algorithmus, der Ausreißer isoliert statt Normalität zu lernen

Isolation Forest funktioniert anders als klassische Methoden: Statt zu lernen, was "normal" ist, lernt er, wie leicht ein Datenpunkt von den anderen zu trennen ist. Anomalien sind per Definition "leichter isolierbar" - sie brauchen weniger Entscheidungen im Baum.

Python · Isolation Forest

Code

from sklearn.ensemble import IsolationForest

# Features für Anomalie-Erkennung
anom_features = [
    'residuum',           # Abweichung vom Erwartungswert
    'abweichung_%',       # Prozentuale Abweichung
    'l_100km',            # Absoluter Verbrauch
    'beladung_t',         # Kontext
    'autobahn_anteil',    # Kontext
    'hoehenmeter',        # Kontext
]

# Rolling-Features: Trend über 4 Wochen
df['residuum_rolling_4w'] = df.groupby('lkw_id')['residuum'].transform(
    lambda x: x.rolling(4, min_periods=2).mean()
)
df['residuum_trend'] = df.groupby('lkw_id')['residuum_rolling_4w'].transform(
    lambda x: x.diff()
)
anom_features += ['residuum_rolling_4w', 'residuum_trend']

X_anom = df[anom_features].dropna()

# Isolation Forest: contamination = erwarteter Anomalie-Anteil
iso = IsolationForest(
    n_estimators=300,
    contamination=0.08,
    max_samples=0.8,
    random_state=42
)
df.loc[X_anom.index, 'anomalie_score'] = iso.fit_predict(X_anom)
df['ist_anomalie'] = (df['anomalie_score'] == -1)

# Evaluation: Vergleich mit echten Anomalien
tp = ((df['ist_anomalie']) & (df['anomalie_aktiv'])).sum()
fp = ((df['ist_anomalie']) & (~df['anomalie_aktiv'])).sum()
fn = ((~df['ist_anomalie']) & (df['anomalie_aktiv'])).sum()
precision = tp / (tp + fp)
recall = tp / (tp + fn)
print(f"Precision: {precision:.3f}")
print(f"Recall:    {recall:.3f}")
print(f"Anomalien erkannt: {df['ist_anomalie'].sum()}")

0.874

Precision

0.891

Recall

624

Anomalie-Wochen erkannt

Fahrzeuge betroffen

Anomalie-Erkennung: Residuen über Zeit - 3 Beispiel-LKW

↳ Was das Modell findet

LKW-089 (orange): Ab Woche 22 steigt der Verbrauch stetig - typisch für einen schleichenden Injektor-Defekt. LKW-034 (rot): Plötzlicher Sprung in Woche 31 - Turbo-Undichtigkeit. LKW-127 (blau): Sporadische Ausreißer - Tempomat-Fehlfunktion, die nur auf bestimmten Strecken auftritt. Drei verschiedene Muster, ein Modell.

05 Anomalie-Klassifikation - Was steckt dahinter?

Das Modell erkennt nicht nur dass etwas falsch ist, sondern deutet auch warum

Anhand des Anomalie-Musters (schleichend vs. plötzlich, konstant vs. sporadisch, beladungsabhängig vs. streckenabhängig) klassifiziert ein zweites Modell die wahrscheinliche Ursache:

Anomalie-Verteilung nach Ursachentyp

LKW-089 · Baujahr 2020 · Euro6d

Mechanisch - Injektor-Defekt

+4.8 l/100km gg. Erwartung

Muster: Schleichend ansteigend seit KW 22 (+0.15 l/Woche). Beladungsunabhängig. Streckenunabhängig.
Kosten seit Beginn: €2.840 Mehrverbrauch + drohender Motorschaden.
Empfehlung: Sofort Werkstatt - Injektoren prüfen, Common-Rail-Druck messen.

LKW-034 · Baujahr 2019 · Euro6d

Mechanisch - Turbolader undicht

+3.2 l/100km gg. Erwartung

Muster: Plötzlicher Anstieg in KW 31. Stärker bei hoher Last (>20t).
Kosten seit Beginn: €1.960 Mehrverbrauch.
Empfehlung: Ladedruckprüfung + Turbo-Sichtkontrolle. Nicht weiter unter Volllast fahren.

LKW-156 · Baujahr 2022 · Euro6e

Fahrverhalten - Neuer Fahrer

+2.1 l/100km gg. Erwartung

Muster: Anstieg korreliert mit Fahrerwechsel (KW 18). Harsh-Braking +60%, Geschwindigkeitsprofil unruhiger.
Kosten seit Beginn: €3.150 Mehrverbrauch (längerer Zeitraum).
Empfehlung: Eco-Driving-Schulung. Erwartete Einsparung: €2.400/Jahr.

LKW-042 · Baujahr 2021 · Euro6e

Strecke - Umleitung seit Baustelle

+1.7 l/100km gg. Erwartung

Muster: Seit KW 28 nur auf bestimmter Relation (FRA→STR). Höhenmeter +40%, Autobahnanteil -25%.
Kosten seit Beginn: €890 Mehrverbrauch.
Empfehlung: Alternative Route über A6 prüfen. Baustelle A5 bis Q2/2025 geplant.

↳ Das versteckte Risiko

Der Injektor-Defekt bei LKW-089 verursacht nicht nur €2.840 Mehrverbrauch - er ist ein Vorläufer eines Motorschadens (€8.000–€15.000). Das Modell hat ihn in Woche 24 erkannt. Ohne Modell wäre er bei der nächsten Inspektion in Woche 38 aufgefallen - 14 Wochen und €1.200 Mehrverbrauch später. Oder als Liegenbleiber auf der A3.

06 Feature Importance - Was den Verbrauch wirklich treibt

Überraschende Erkenntnisse aus dem Erwartungswert-Modell

Feature Importance - Erwartungswert-Modell (XGBoost)

↳ Was der Fuhrparkleiter wissen sollte

Die Außentemperatur erklärt 14% des Verbrauchs - und ist nicht beeinflussbar. Aber: Autobahnanteil (21%) und Beladung (18%) sind es. Das Modell zeigt, welche Touren-Konfigurationen systematisch mehr Diesel kosten als nötig - und wo eine Umplanung den größten Hebel hat.

07 Business Impact - Was frühe Erkennung spart

Dieselkosten + vermiedene Reparaturen + weniger Ausfälle

Python · ROI-Berechnung

Code

# === EINSPARUNG DURCH ANOMALIE-ERKENNUNG ===

# 1. Diesel-Mehrverbrauch vermeiden (frühere Reparatur)
# Durchschnittlich 8 Wochen frühere Erkennung als Werkstatt
lkw_mit_anomalie = 18
avg_mehrverbrauch_l_woche = 55  # l/Woche Mehrverbrauch
wochen_frueher = 8
diesel_preis = 1.42
ersparnis_diesel = lkw_mit_anomalie * avg_mehrverbrauch_l_woche * wochen_frueher * diesel_preis

# 2. Folgeschäden vermeiden
folgeschaden_rate = 0.35   # 35% der Defekte führen zu Folgeschaden
avg_folgeschaden = 6500    # € pro Folgeschaden
vermiedene_schaeden = int(lkw_mit_anomalie * folgeschaden_rate)
ersparnis_folge = vermiedene_schaeden * avg_folgeschaden

# 3. Pannenvermeidung
pannen_rate = 0.20        # 20% der unerkannten Defekte → Panne
kosten_panne = 2800       # Pannendienst + Standzeit + Umplanung
vermiedene_pannen = int(lkw_mit_anomalie * pannen_rate)
ersparnis_pannen = vermiedene_pannen * kosten_panne

# 4. Eco-Driving-Effekte (Fahrverhalten-Anomalien)
fahrverhalten_lkw = 5     # Fahrzeuge mit Fahrverhalten-Anomalie
ersparnis_eco = fahrverhalten_lkw * 2400  # €/Jahr pro Fahrer nach Schulung

total = ersparnis_diesel + ersparnis_folge + ersparnis_pannen + ersparnis_eco

print(f"Diesel-Einsparung:      €{ersparnis_diesel:>10,.0f}")
print(f"Folgeschäden vermieden: €{ersparnis_folge:>10,.0f}")
print(f"Pannen vermieden:       €{ersparnis_pannen:>10,.0f}")
print(f"Eco-Driving:            €{ersparnis_eco:>10,.0f}")
print(f"{'─'*40}")
print(f"GESAMT:                 €{total:>10,.0f}")

Jährliches Einsparpotenzial nach Kategorie

€96.260

Gesamte Einsparung / Jahr

3.2%

Diesel-Kostenreduktion

Kategorie	Betrag/Jahr	Mechanismus	Sicherheit
Folgeschäden vermieden	€40.950	6 Folgeschäden à €6.500 verhindert	Hoch
Diesel-Mehrverbrauch	€22.310	8 Wochen frühere Erkennung × 18 LKW	Hoch
Eco-Driving	€12.000	5 Fahrer nach Schulung: –2.400€/Jahr	Mittel
Pannenvermeidung	€11.200	4 Pannen à €2.800 vermieden	Hoch
Sonstiges (Routen, Standheizung)	€9.800	Routen- und Standheizungsoptimierung	Mittel

↳ Der überraschende Haupthebel

Nicht der Diesel selbst ist der größte Posten - sondern die vermiedenen Folgeschäden (€40.950). Ein Injektor-Defekt, der 10 Wochen unerkannt bleibt, beschädigt den Motor. Die Anomalie-Erkennung ist damit nicht nur ein Diesel-Spar-Tool, sondern ein Predictive-Maintenance-System, das sich über vermiedene Werkstattkosten finanziert.

08 Nächste Schritte

Vom Wochenbericht zum Echtzeit-Alert

① Tankkarten-Anbindung

Automatischer Import aus DKV/UTA/Shell-Card. Kombination mit Telematik-Daten (Fleetboard, TomTom). Wöchentliche Batch-Analyse.

② Alert-System

Automatische E-Mail an Werkstattleiter bei Anomalie-Score > Schwelle. Inkl. Ursachen-Klassifikation und empfohlener Maßnahme.

③ Fahrer-Cockpit

Individuelles Verbrauchsfeedback für jeden Fahrer: "Diese Woche 1.4 l/100km unter Ihrem Schnitt - gut gemacht." Gamification statt Kontrolle.

Vorheriges Modul M04 Leerfahrten-Analyse

Nächstes Modul M06 Auftragsvolumen-Forecasting

Dieselverbrauch-Anomalien:Was Ihr Tank über Ihre Flotte verrät

01 Das unsichtbare Problem - Warum Durchschnitte lügen

02 Datengrundlage - Tankungen, Telematik, Topografie

03 Erwartungswert-Modell - Was sollte dieser LKW verbrauchen?

04 Isolation Forest - Anomalien automatisch erkennen

05 Anomalie-Klassifikation - Was steckt dahinter?

06 Feature Importance - Was den Verbrauch wirklich treibt

07 Business Impact - Was frühe Erkennung spart

08 Nächste Schritte

Dieselverbrauch-Anomalien:
Was Ihr Tank über Ihre Flotte verrät