DeepSeek-V3.2-Exp

Всего через неделю после выхода предыдущей «финальной» версии китайская компания DeepSeek представила новую экспериментальную модель — DeepSeek-V3.2-Exp.

Китайская AI-модель-«ценовой убийца» выходит на новый уровень

Этот шаг, анонсированный 29 сентября 2025 года, позиционируется как «промежуточный шаг к новому поколению архитектуры» и приносит с собой революционное повышение эффективности и беспрецедентное снижение стоимости использования искусственного интеллекта.

Технологический прорыв

Сердце новой модели — DeepSeek Sparse Attention (DSA)

Ключевым нововведением DeepSeek-V3.2-Exp стала DeepSeek Sparse Attention (DSA) — механизм разреженного внимания, впервые реализованный на таком уровне детализации.

Принцип работы: В отличие от традиционных механизмов внимания в Transformer-архитектурах, которые требуют вычисления взаимосвязей между всеми элементами последовательности (сложность O(n²)), DSA избирательно рассчитывает только самые важные связи. Это похоже на то, как человек читает длинный текст, концентрируясь на ключевых словах и предложениях, а не на каждом символе с одинаковой интенсивностью.

Результат: Этот подход позволяет значительно повысить эффективность обработки длинных текстов как при обучении, так и при выводе модели (инференсе), практически не влияя на качество её ответов. По данным технического анализа, это приводит к увеличению скорости inference в 2-3 раза и снижению использования памяти на 30-40%.

Экономический эффект

Стоимость API снижена более чем вдвое

Благодаря резкому росту эффективности вычислений DeepSeek незамедлительно провела масштабное снижение цен для разработчиков. Стоимость использования официального API снижена более чем на 50%.

Сравнительная таблица новых тарифов (за 1 млн токенов):

Направление	Условие	Старая цена	Новая цена
Ввод	Кэш попадание	~$0.10	$0.07
Ввод	Кэш промах	~$0.56	$0.28
Вывод	—	~$1.68	$0.42

Это ценовое преимущество кардинально отличает DeepSeek от основных конкурентов. Например, стоимость ввода для DeepSeek-V3.2-Exp составляет лишь малую долю от цены GPT-4o ($2.50 за 1 млн токенов) и особенно ChatGPT o1 ($15 за 1 млн токенов). Такой агрессивный ценовой подход закрепил за компанией репутацию «ценового убийцы» или «AI-версии Pinduoduo» в мире искусственного интеллекта.

Открытость и сообщество

Полная открытость кода и моделей

DeepSeek продолжает стратегию открытости, выложив DeepSeek-V3.2-Exp в открытый доступ на платформах Hugging Face и ModelScope. Помимо самой модели, компания также открыла исходный код новых GPU-операторов, реализованных на двух языках: высокоуровневом TileLang (для исследований и отладки) и низкоуровневом CUDA (для высокой производительности). Это решение позволяет мировому научному и developer-сообществу не только использовать, но и глубоко изучать, модифицировать и улучшать лежащие в основе модели технологии.

Глобальный контекст

От R1 до V3.2 — путь восхождения

Успех новой модели — часть стремительного взлёта DeepSeek на глобальной AI-сцене. Основанная в мае 2023 года и связанная с инвестиционной компанией Huanfang Quant, DeepSeek привлекла worldwide внимание в январе 2025 года с выпуском своей модели DeepSeek-R1.

Мировое признание: Мобильное приложение DeepSeek тогда же возглавило топы загрузок в Apple App Store не только в Китае, но и в США, Великобритании, Японии, Южной Корее и ОАЭ.

«Эффективность вопреки»: Модель R1 продемонстрировала конкурентоспособность с флагманскими моделями вроде OpenAI o1 в решении математических и программистских задач, но при этом, по заявлениям компании, была обучена с гораздо меньшими затратами — около $6 миллионов против предполагаемых $100-200 миллионов у o1.

Что ждет DeepSeek дальше?

Анонс экспериментальной V3.2-Exp четко указывает на то, что DeepSeek не останавливается на достигнутом. Модель является испытательным стендом для новых архитектурных решений на пути к DeepSeek-V4. Компания оставила возможность для разработчиков до 15 октября 2025 года тестировать предыдущую версию, V3.1-Terminus, по новым, сниженным ценам, чтобы собрать максимальный объем обратной связи перед окончательным переходом.

Рынок искусственного интеллекта продолжает нагреваться. В то время как DeepSeek выпускает V3.2, другие китайские гиганты, такие как Zhipu с моделью GLM-4.6 и Moonshot AI с агентом Kimi, также анонсируют свои обновления, что знаменует собой новую волну интенсивной конкуренции в отрасти.

Таким образом, выход DeepSeek-V3.2-Exp — это не просто очередное обновление модели. Это заявление о намерениях, подкрепленное передовой технологией и агрессивной ценовой политикой, которое усиливает позиции Китая как одного из ключевых игроков в глобальной гонке искусственного интеллекта.

Опубликовано: 29.09.2025 13:00:12

Репозитории

@mosregdata

ВКонтакте