Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее.

← Вернуться к статьям

Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее.

8 января в 14:55

habr.comтехнологии

Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее.

8 января в 14:55•

habr.com•технологии

Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее. Эксперимент по хирургическому удалению слоёв из языковой модели Современные LLM переобучены — многие слои делают одно и то же. Я проверил эту гипотезу на практике: взял TinyLlama (1.1B параметров, 22 слоя) и измерил, как удаление каждого слоя влияет на perplexity. Результаты: • Удаление 1 среднего слоя: +10% скорость, -4% качество • Удаление 7 «безопасных» слоёв: +32% скорость, -2.5% качество • Удаление первого слоя: модель полностью ломается Неожиданно: Layer 2 важнее Layer...

Еще статьи из категории

Еще статьи

← Вернуться к статьям

8 января в 14:55

habr.comтехнологии

Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее.

8 января в 14:55•

habr.com•технологии

ВСЕ СТАТЬИ

Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее.

Еще статьи из категории

Еще статьи

ВСЕ СТАТЬИ

Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее.

Еще статьи из категории

Еще статьи