ST‑Raptor: Agentisches System für semistrukturierte Tabellen‑QA
Die Beantwortung von Fragen zu semistrukturierten Tabellen stellt eine komplexe Herausforderung dar, die sowohl die präzise Extraktion von Zellinhalten und deren Positionen als auch die genaue Rekonstruktion von impliziten logischen Strukturen, hierarchischen Beziehungen und semantischen Assoziationen erfordert. In der Praxis werden solche Tabellen häufig von menschlichen Experten manuell interpretiert, was sehr arbeitsintensiv und zeitaufwendig ist. Automatisierte Lösungen bleiben bislang schwierig.
Herkömmliche Text‑zu‑SQL‑Methoden wandeln semistrukturierte Tabellen in strukturierte Formate um, was zwangsläufig zu Informationsverlust führt. Ansätze wie Text‑zu‑Code oder multimodale große Sprachmodelle (LLM) kämpfen mit komplexen Layouts und liefern oft ungenaue Antworten.
ST‑Raptor löst diese Probleme mit einem agentischen System, das ein interaktives Analyse‑Umfeld bietet. Es kombiniert visuelles Editing, baumbasierte Strukturmodellierung und agentengetriebene Abfrageauflösung, um Tabellen präzise und benutzerfreundlich zu verstehen. Durch die direkte Interaktion mit dem Nutzer können Fehler frühzeitig erkannt und korrigiert werden.
Experimentelle Ergebnisse auf Benchmark‑ und realen Datensätzen zeigen, dass ST‑Raptor sowohl in der Genauigkeit als auch in der Benutzerfreundlichkeit bestehende Methoden übertrifft. Der Quellcode ist unter GitHub verfügbar, und ein Demo‑Video steht unter YouTube bereit.