TiCard: KI-basierte Korrektur für Kardinalitätsabschätzungen ohne Integration

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Die Genauigkeit der Kardinalitätsabschätzung ist ein entscheidender Engpass bei der kostenbasierten Optimierung von Datenbankabfragen. Klassische Schätzer vernachlässigen oft Korrelationen, während lernbasierte Modelle häufig auf aufwändige, work‑load‑spezifische Trainingspipelines und invasive Optimizer‑Integration angewiesen sind. TiCard löst dieses Problem mit einem leichtgewichtigen, korrigierenden Ansatz, der die native Schätzung eines Datenbanksystems lediglich ergänzt.

TiCard lernt multiplikative Residual‑Korrekturen ausschließlich aus EXPLAIN‑Only‑Features. Für die Offline‑Label wird lediglich EXPLAIN ANALYZE benötigt, sodass keine zusätzlichen Laufzeitkosten entstehen. Der Ansatz ist damit vollständig deploybar und erfordert keine tiefgreifende Änderung der bestehenden Optimierungsarchitektur.

In praktischen Tests auf TiDB mit TPCH und dem Join Order Benchmark zeigte TiCard beeindruckende Ergebnisse. Für die Gradient‑Boosting‑Regressor‑Variante sank der P90‑Q‑Error von 312,85 auf 13,69, während der P99‑Wert von 37 974,37 auf 3 416,50 fiel. Die TabPFN‑Variante, ein in‑Context‑Tabular‑Foundation‑Model, erreichte ähnliche Verbesserungen und kann durch Aktualisierung einer kleinen Referenzmenge ohne Gradient‑Retraining weiter optimiert werden. Trotz dieser starken Verbesserungen bleibt die Median‑Leistung nahezu unverändert, was die Stabilität des Ansatzes unterstreicht.

TiCard wird als AI4DB‑Baustein konzipiert, der auf Deployability ausgelegt ist: klar definierter Umfang, konservative Integrationsrichtlinien und ein Roadmap von Offline‑Korrekturen bis zur in‑Optimizer‑Nutzung. Damit bietet TiCard eine praktikable Lösung, um die Kardinalitätsabschätzung in produktiven Datenbanksystemen signifikant zu verbessern, ohne die bestehende Infrastruktur zu stark zu verändern.

Ähnliche Artikel