Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “multimodale Interaktion”
Forschung

<p>LLM-gesteuertes Pepper-Framework für schnelle, multimodale Interaktion</p> <p>Ein neues, quelloffenes Android-Framework wurde speziell für den Pepper-Roboter entwickelt und löst zwei zentrale Probleme, die bei der Integration großer Sprachmodelle in soziale Robotik auftreten. Traditionelle Implementierungen setzen häufig auf eine Kaskade aus Speech‑to‑Text, LLM‑Verarbeitung und Text‑to‑Speech, was zu hohen Latenzen und dem Verlust paralinguistischer Signale führt. Zudem nutzen viele Systeme die Fähigkeit

arXiv – cs.AI