ELT-Bench-Verified: Benchmark-Fehler unterschätzen KI-Agenten-Fähigkeiten
In einer aktuellen Untersuchung wurde das ELT-Bench, der erste Benchmark für die komplette Konstruktion von Extract‑Load‑Transform‑Pipelines, neu bewertet. Anfangs zeigten KI‑Agenten nur geringe Erfolgsraten, was den Eindruck erweckte, sie seien praktisch nutzlos. Die neue Analyse zeigt jedoch, das…