ST‑Raptor: KI‑gestützte Frage‑Antwortung für halbstrukturierte Tabellen
Die neue Methode ST‑Raptor, vorgestellt auf arXiv (2508.18190v2), nutzt große Sprachmodelle, um Fragen zu halbstrukturierten Tabellen automatisch zu beantworten. Diese Tabellen, die in Bereichen wie Finanzberichten, medizinischen Aufzeichnungen oder Bestelllisten vorkommen, zeichnen sich durch flexible, verschachtelte Kopfzeilen und zusammengeführte Zellen aus.
Aktuelle Ansätze wie NL2SQL wandeln solche Tabellen in reine Datenbanken um, was häufig zu Informationsverlust führt. NL2Code‑ und multimodale LLM‑Lösungen können die komplexen Layouts nicht zuverlässig interpretieren, sodass die Antworten ungenau bleiben. ST‑Raptor begegnet diesen Problemen mit einem baum‑basierten Ansatz.
Im Zentrum steht der Hierarchical Orthogonal Tree (HO‑Tree), ein strukturelles Modell, das die verschachtelte Anordnung der Tabellen exakt abbildet. Durch einen effizienten Baum‑Aufbaualgorithmus wird die gesamte Tabellenstruktur in einen leicht durchsuchbaren Graphen überführt. Anschließend definiert ST‑Raptor eine Reihe einfacher Baum‑Operationen, die das Sprachmodell anleiten, typische Frage‑Antwort‑Aufgaben Schritt für Schritt auszuführen.
Bei einer Nutzerfrage zerlegt ST‑Raptor die Frage in mehrere Teilfragen, erstellt zu jedem Teil eine Pipeline aus Baum‑Operationen und führt diese in einer präzisen Ausrichtung mit der Tabellenstruktur aus. So wird sichergestellt, dass jede Operation exakt auf die relevanten Zellen und Header abzielt.
Zur Gewährleistung der Genauigkeit nutzt das System ein zweistufiges Verifizierungsverfahren. Die „forward validation“ prüft die Richtigkeit jeder Ausführungsschritt, während die „backward validation“ die Zuverlässigkeit der Endantwort bewertet. Dieses doppelte Kontrollsystem reduziert Fehler und erhöht die Vertrauenswürdigkeit der Ergebnisse.
ST‑Raptor bietet damit eine effiziente, kostengünstige Alternative zu manuellen Analysen. Durch die Kombination von LLM‑Intelligenz, baum‑basiertem Layout‑Verständnis und robusten Validierungsmechanismen können Unternehmen komplexe Tabelleninhalte schnell und zuverlässig auswerten.