TrustBench: Echtzeit-Verifizierung von Agenten für sichere Aktionen
Mit der rasanten Weiterentwicklung großer Sprachmodelle von reinen Chatbots zu autonomen Agenten wird die Gewährleistung von Vertrauenswürdigkeit zu einer zentralen Herausforderung. Traditionelle Bewertungsansätze wie A…