Pruning vor Quantisierung? Studie zeigt Reihenfolge entscheidend
In der Welt der KI-Modelle gewinnt die effiziente Kompression immer mehr an Bedeutung. Doch wie wirkt sich die Reihenfolge von Pruning und Quantisierung auf die Leistung aus? Eine neue Studie von Forschern auf arXiv bel…