GBV-SQL: Guided Generation and SQL2Text Back-Translation Validation for Multi-Agent Text2SQL
Anzeige
Ähnliche Artikel
arXiv – cs.AI
•
ChartAnchor: Neuer Benchmark für Chart‑Verständnis in multimodalen Modellen
arXiv – cs.AI
•
A^2Flow: Automatisierte Agenten-Workflow-Generierung mit adaptiven Operatoren
arXiv – cs.AI
•
SPAN: Benchmark für interkalenderische Zeitlogik von LLMs
arXiv – cs.AI
•
Rethinking Toxicity Evaluation in Large Language Models: A Multi-Label Perspective
arXiv – cs.AI
•
HardcoreLogic: Benchmark prüft Logikmodelle mit seltenen Rätselvarianten
arXiv – cs.AI
•
FATHOMS-RAG: A Framework for the Assessment of Thinking and Observation in Multimodal Systems that use Retrieval Augmented Generation