Generatives Active Testing: Effiziente LLM‑Bewertung durch Proxy‑Task‑Anpassung
Mit der rasanten Verbreitung vortrainierter Large Language Models (LLMs) wächst die Nachfrage nach domänenspezifischen Testsets, insbesondere in sensiblen Bereichen wie Gesundheit und Biomedizin. Die Erstellung solcher…