Princeton выпустил единый репозиторий для сжатия больших языковых моделей
Исследователи из Принстонского университета выпустили LLM-Pruning Collection — репозиторий на JAX, который объединяет основные алгоритмы прунинга (сжатия) больших языковых моделей в единую воспроизводимую среду.