ВСЕ СТАТЬИ

← Вернуться к статьям
Маленькая модель обыграла большие: почему Nanbeige4-3B меняет правила игры.
27 декабря в 10:54
habr.comтехнологии

Маленькая модель обыграла большие: почему Nanbeige4-3B меняет правила игры.

27 декабря в 10:54•faviconhabr.com•технологии

Маленькая модель обыграла большие: почему Nanbeige4-3B меняет правила игры. В ноябре вышла модель Nanbeige4-3B-25-11 (а 6 декабря они выложили статью об обучении на arxiv). Её размер всего лишь 3 миллиарда параметров. Это почти в 100 раз меньше, чем GPT-4, и даже меньше, чем большинство открытых моделей. Но вот парадокс: на тестах она достигает показателей выше, чем модели в 10 раз больше, а на бенчмарке WritingBench и вовсе держится на уровне проприетарных моделей занимая место между Gemini-2.5-Pro и Deepseek-R1-0528. В своей предыдущей публикации я уже затраг...

Еще статьи из категории

Еще статьи