JT-DA-8B: KI-Modell revolutioniert Tabellenanalyse mit Tool-gestütztem Denken

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Das neue Modell JT-DA-8B – kurz JiuTian Data Analyst 8B – setzt neue Maßstäbe bei der Analyse komplexer Tabellen. Entwickelt wurde es speziell für anspruchsvolle Tabellen‑Reasoning‑Aufgaben, die in vielen realen Anwendungsfällen auftreten.

Um die fehlende hochwertige Anleitung in diesem Bereich zu kompensieren, hat das Forschungsteam einen umfangreichen Trainingskorpus erstellt. Dieser umfasst 34 klar definierte Tabellen‑Reasoning‑Aufgaben, die aus 29 öffentlichen QA‑Datensätzen sowie 3 Millionen Tabellen zusammengetragen wurden. Ein automatisierter Pipeline-Ansatz generiert dabei realistische, mehrstufige Analyseaufgaben, die typische Denkprozesse abbilden.

JT-DA-8B baut auf dem Open‑Source‑Modell JT‑Coder‑8B auf, einem 8‑Billionen‑Parameter‑Decoder‑Only‑Foundation‑Model, das von Grund auf neu trainiert wurde. Während der Trainingsphase werden LLM‑basierte Scoring‑Methoden und workflow‑ausgerichtetes Filtern eingesetzt, um besonders hochwertige, tabellenorientierte Daten zu extrahieren. Das Modell wird anschließend sowohl durch supervised fine‑tuning (SFT) als auch durch Reinforcement Learning (RL) optimiert.

Ein vierstufiger Arbeitsablauf – Tabellen‑Preprocessing, Tabellen‑Sensing, tool‑integriertes Reasoning und Prompt Engineering – wird eingeführt, um die Interpretierbarkeit und Ausführungsgenauigkeit weiter zu verbessern. Die experimentellen Ergebnisse zeigen, dass JT-DA-8B in einer Vielzahl von Tabellen‑Reasoning‑Aufgaben hervorragende Leistungen erbringt und damit die Wirksamkeit daten‑zentrierter Generierung sowie workflow‑getriebener Optimierung bestätigt.

Ähnliche Artikel