Журнал «Современная Наука»

СИСТЕМАТИЗАЦИЯ МЕТОДОВ СЖАТИЯ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ ПО ФАЗЕ ПРИМЕНЕНИЯ И ХАРАКТЕРУ ВОЗДЕЙСТВИЯ

Баязитов Фанур Анурович (Уфимский государственный нефтяной технический университет)

Современные большие языковые модели (LLM) демонстрируют высокое качество в широком спектре задач, однако их масштаб затрудняет развёртывание в условиях ограниченных вычислительных ресурсов. Существующие обзоры методов сжатия LLM фокусируются преимущественно на технической таксономии — прореживание, квантование, дистилляция — и не отражают ни времени вмешательства в жизненный цикл модели, ни природы изменений. Это ограничивает возможность осознанного выбора стратегии сжатия в зависимости от доступных этапов модификации и требуемого баланса между эффективностью и гибкостью. Гипотеза исследования Двумерная классификация по фазе применения и типу воздействия позволяет выявить фундаментальный компромисс между структурной устойчивостью и контекстной адаптивностью, что делает возможным обоснованный выбор метода сжатия с учётом доступного этапа вмешательства и природы целевых ограничений. Результаты Предложенная классификация выявляет устойчивую тенденцию: смещение от статических методов на ранних фазах к динамическим — на этапе инференса. Анализ показывает, что статические методы обеспечивают предсказуемое сокращение ресурсов, но требуют модификации модели, тогда как динамические сохраняют исходные веса, но зависят от контекста и аппаратуры. Наиболее значимый пробел — отсутствие динамических методов на ранних этапах. Полученные выводы формируют основу для осознанного выбора стратегии сжатия LLM в зависимости от доступных этапов вмешательства и практических ограничений.

Ключевые слова:большие языковые модели, сжатие моделей, динамическое сжатие, статическое сжатие, жизненный цикл модели

Читать полный текст статьи …

Ссылка для цитирования:
Баязитов Ф. А. СИСТЕМАТИЗАЦИЯ МЕТОДОВ СЖАТИЯ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ ПО ФАЗЕ ПРИМЕНЕНИЯ И ХАРАКТЕРУ ВОЗДЕЙСТВИЯ // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и Технические Науки. -2026. -№01. -С. 59-63 DOI 10.37882/2223-2966.2026.01.09

ПРАВОВАЯ ИНФОРМАЦИЯ:
Перепечатка материалов допускается только в некоммерческих целях со ссылкой на оригинал публикации. Охраняется законами РФ. Любые нарушения закона преследуются в судебном порядке.
© ООО "Научные технологии"