ВСЕ СТАТЬИ

← Вернуться к статьям
[Перевод] От GPT-2 к gpt-oss: анализ достижений архитектуры.

[Перевод] От GPT-2 к gpt-oss: анализ достижений архитектуры.

5 октября в 07:41
habr.comтехнологии
5 октября в 07:41•faviconhabr.com•технологии

[Перевод] От GPT-2 к gpt-oss: анализ достижений архитектуры. 📝 Описание На этой неделе разбираем релиз GPT-OSS — первых полностью открытых моделей OpenAI с момента GPT-2 в 2019 году. Две модели: gpt-oss-20b и gpt-oss-120b представляют собой современные LLM с архитектурой MoE (Mixture of Experts), оптимизированные для рассуждений и способные работать на одном GPU благодаря квантованию MXFP4.

Еще статьи из категории

Еще статьи