LLMs meistern Verhandlungen: Lernen mit verifizierbaren Belohnungen
Die jüngsten Fortschritte bei großen Sprachmodellen (LLMs) haben gezeigt, dass sie als autonome Interaktionsagenten eingesetzt werden können. In der Praxis stoßen sie jedoch häufig an Grenzen, wenn es um strategische Sp…