Баязитов Фанур Анурович (Уфимский государственный нефтяной технический университет)
| |
Современные большие языковые модели (LLM) демонстрируют высокое качество в широком спектре задач, однако их масштаб затрудняет развёртывание в условиях ограниченных вычислительных ресурсов. Существующие обзоры методов сжатия LLM фокусируются преимущественно на технической таксономии — прореживание, квантование, дистилляция — и не отражают ни времени вмешательства в жизненный цикл модели, ни природы изменений. Это ограничивает возможность осознанного выбора стратегии сжатия в зависимости от доступных этапов модификации и требуемого баланса между эффективностью и гибкостью.
Гипотеза исследования
Двумерная классификация по фазе применения и типу воздействия позволяет выявить фундаментальный компромисс между структурной устойчивостью и контекстной адаптивностью, что делает возможным обоснованный выбор метода сжатия с учётом доступного этапа вмешательства и природы целевых ограничений.
Результаты
Предложенная классификация выявляет устойчивую тенденцию: смещение от статических методов на ранних фазах к динамическим — на этапе инференса. Анализ показывает, что статические методы обеспечивают предсказуемое сокращение ресурсов, но требуют модификации модели, тогда как динамические сохраняют исходные веса, но зависят от контекста и аппаратуры. Наиболее значимый пробел — отсутствие динамических методов на ранних этапах. Полученные выводы формируют основу для осознанного выбора стратегии сжатия LLM в зависимости от доступных этапов вмешательства и практических ограничений.
Ключевые слова:большие языковые модели, сжатие моделей, динамическое сжатие, статическое сжатие, жизненный цикл модели
|
|
| |
|
Читать полный текст статьи …
|
Ссылка для цитирования: Баязитов Ф. А. СИСТЕМАТИЗАЦИЯ МЕТОДОВ СЖАТИЯ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ ПО ФАЗЕ ПРИМЕНЕНИЯ И ХАРАКТЕРУ ВОЗДЕЙСТВИЯ // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2026. -№01. -С. 59-63 DOI 10.37882/2223-2966.2026.01.09 |
|
|