DeepSeek-V3.2-Exp
Всего через неделю после выхода предыдущей «финальной» версии китайская компания DeepSeek представила новую экспериментальную модель — DeepSeek-V3.2-Exp.
Китайская AI-модель-«ценовой убийца» выходит на новый уровень
Этот шаг, анонсированный 29 сентября 2025 года, позиционируется как «промежуточный шаг к новому поколению архитектуры» и приносит с собой революционное повышение эффективности и беспрецедентное снижение стоимости использования искусственного интеллекта.
Технологический прорыв
Сердце новой модели — DeepSeek Sparse Attention (DSA)
Ключевым нововведением DeepSeek-V3.2-Exp стала DeepSeek Sparse Attention (DSA) — механизм разреженного внимания, впервые реализованный на таком уровне детализации.
Принцип работы: В отличие от традиционных механизмов внимания в Transformer-архитектурах, которые требуют вычисления взаимосвязей между всеми элементами последовательности (сложность O(n²)), DSA избирательно рассчитывает только самые важные связи. Это похоже на то, как человек читает длинный текст, концентрируясь на ключевых словах и предложениях, а не на каждом символе с одинаковой интенсивностью.
Результат: Этот подход позволяет значительно повысить эффективность обработки длинных текстов как при обучении, так и при выводе модели (инференсе), практически не влияя на качество её ответов. По данным технического анализа, это приводит к увеличению скорости inference в 2-3 раза и снижению использования памяти на 30-40%.
Экономический эффект
Стоимость API снижена более чем вдвое
Благодаря резкому росту эффективности вычислений DeepSeek незамедлительно провела масштабное снижение цен для разработчиков. Стоимость использования официального API снижена более чем на 50%.
Сравнительная таблица новых тарифов (за 1 млн токенов):
Направление | Условие | Старая цена | Новая цена |
---|---|---|---|
Ввод | Кэш попадание | ~$0.10 | $0.07 |
Ввод | Кэш промах | ~$0.56 | $0.28 |
Вывод | — | ~$1.68 | $0.42 |
Это ценовое преимущество кардинально отличает DeepSeek от основных конкурентов. Например, стоимость ввода для DeepSeek-V3.2-Exp составляет лишь малую долю от цены GPT-4o ($2.50 за 1 млн токенов) и особенно ChatGPT o1 ($15 за 1 млн токенов). Такой агрессивный ценовой подход закрепил за компанией репутацию «ценового убийцы» или «AI-версии Pinduoduo» в мире искусственного интеллекта.
Открытость и сообщество
Полная открытость кода и моделей
DeepSeek продолжает стратегию открытости, выложив DeepSeek-V3.2-Exp в открытый доступ на платформах Hugging Face и ModelScope. Помимо самой модели, компания также открыла исходный код новых GPU-операторов, реализованных на двух языках: высокоуровневом TileLang (для исследований и отладки) и низкоуровневом CUDA (для высокой производительности). Это решение позволяет мировому научному и developer-сообществу не только использовать, но и глубоко изучать, модифицировать и улучшать лежащие в основе модели технологии.
Глобальный контекст
От R1 до V3.2 — путь восхождения
Успех новой модели — часть стремительного взлёта DeepSeek на глобальной AI-сцене. Основанная в мае 2023 года и связанная с инвестиционной компанией Huanfang Quant, DeepSeek привлекла worldwide внимание в январе 2025 года с выпуском своей модели DeepSeek-R1.
Мировое признание: Мобильное приложение DeepSeek тогда же возглавило топы загрузок в Apple App Store не только в Китае, но и в США, Великобритании, Японии, Южной Корее и ОАЭ.
«Эффективность вопреки»: Модель R1 продемонстрировала конкурентоспособность с флагманскими моделями вроде OpenAI o1 в решении математических и программистских задач, но при этом, по заявлениям компании, была обучена с гораздо меньшими затратами — около $6 миллионов против предполагаемых $100-200 миллионов у o1.
Что ждет DeepSeek дальше?
Анонс экспериментальной V3.2-Exp четко указывает на то, что DeepSeek не останавливается на достигнутом. Модель является испытательным стендом для новых архитектурных решений на пути к DeepSeek-V4. Компания оставила возможность для разработчиков до 15 октября 2025 года тестировать предыдущую версию, V3.1-Terminus, по новым, сниженным ценам, чтобы собрать максимальный объем обратной связи перед окончательным переходом.
Рынок искусственного интеллекта продолжает нагреваться. В то время как DeepSeek выпускает V3.2, другие китайские гиганты, такие как Zhipu с моделью GLM-4.6 и Moonshot AI с агентом Kimi, также анонсируют свои обновления, что знаменует собой новую волну интенсивной конкуренции в отрасти.
Таким образом, выход DeepSeek-V3.2-Exp — это не просто очередное обновление модели. Это заявление о намерениях, подкрепленное передовой технологией и агрессивной ценовой политикой, которое усиливает позиции Китая как одного из ключевых игроков в глобальной гонке искусственного интеллекта.
Опубликовано: