В последние месяцы имя DeepSeek не сходит с заголовков крупнейших мировых изданий. Китайский стартап, о котором год назад мало кто слышал за пределами Поднебесной, совершил настоящий прорыв в области искусственного интеллекта, представив модели, которые, по его словам, не уступают, а в некоторых аспектах даже превосходят разработки OpenAI, Google и Meta.
Но не только технологические достижения сделали DeepSeek объектом пристального внимания. Заявленная стоимость обучения их флагманской модели DeepSeek-V3 – всего 6 миллионов долларов – заставила аналитиков и инвесторов задуматься: действительно ли ИИ требует миллиардных вложений, на которые западные компании тратят свои ресурсы?
Эта новость буквально взорвала рынок. Уже через несколько недель DeepSeek AI Assistant, основанный на модели V3, стал самым скачиваемым бесплатным приложением в американском App Store, обогнав даже ChatGPT.
Однако на фоне всеобщего восторга появились и сомнения. Насколько реалистичны эти заявления? Каким образом китайский стартап получил доступ к мощнейшим чипам Nvidia, несмотря на американские санкции? И не является ли DeepSeek частью более широкой геополитической игры, в которой Китай стремится к технологической независимости?
Разбираемся в деталях.
Почему DeepSeek вызвал такую бурю эмоций?
С момента появления ChatGPT в 2022 году китайские компании начали лихорадочно разрабатывать собственные версии больших языковых моделей (LLM). Однако долгое время их разработки значительно уступали американским аналогам. Даже Baidu, один из крупнейших игроков на китайском рынке технологий, не смог создать продукт, сравнимый с решениями OpenAI.
Но в конце 2024 года DeepSeek внезапно перевернул эту картину, представив две модели:
- DeepSeek-V3 – универсальную модель, которая, по заявлениям разработчиков, соперничает с передовыми системами OpenAI и Meta.
- DeepSeek-R1 – более узкоспециализированную модель, которая в 20–50 раз дешевле OpenAI GPT-4o при выполнении некоторых задач.
Эти заявления поразили Кремниевую долину. Многие инженеры и эксперты в сфере ИИ начали публично восхищаться качеством работы китайской модели. Некоторые даже заявили, что DeepSeek-R1 работает эффективнее GPT-4 в узкоспециализированных сценариях.
Но вместе с этим возникли и серьезные вопросы.
Александр Ван, CEO Scale AI, в интервью CNBC заявил, что DeepSeek располагает 50 000 чипов Nvidia H100 – это практически невероятно, учитывая жесткие санкции США, запрещающие продажу таких процессоров в Китай. Если эта информация верна, возникает вопрос: каким образом китайский стартап смог обойти американские экспортные ограничения?
Кроме того, аналитики Bernstein указали на нестыковки в расчетах. Обучение даже самых эффективных языковых моделей требует гораздо больше затрат, чем заявленные DeepSeek 6 миллионов долларов. Скорее всего, в эту сумму включены только чистые вычислительные ресурсы, но не учитываются стоимость инфраструктуры, найма специалистов, электроэнергии и хранения данных.
Так или иначе, если DeepSeek действительно достиг таких успехов при столь низких затратах, это может полностью изменить экономику развития ИИ и заставить крупнейших игроков пересмотреть свои стратегии.
Кто стоит за DeepSeek?
DeepSeek – не просто случайный стартап. Компанию контролирует Лян Вэньфэн, сооснователь китайского хедж-фонда High-Flyer.
Этот фонд известен квантовым трейдингом – сложной математической торговлей на фондовых рынках с использованием алгоритмов ИИ. Однако в 2023 году High-Flyer изменил стратегию и объявил, что направит ресурсы на создание AGI (Искусственного Общего Интеллекта) – технологий, которые потенциально могут превзойти человека в большинстве интеллектуальных задач.
Ключевые факты о DeepSeek и High-Flyer:
✅ High-Flyer вложил значительные ресурсы в DeepSeek, но точные суммы остаются неизвестными.
✅ В 2022 году компания заявила, что управляет кластером из 10 000 Nvidia A100 – предшественников чипов H100.
✅ High-Flyer владеет патентами на чип-кластеры, используемые для обучения больших языковых моделей.
✅ Офисы High-Flyer и DeepSeek расположены в одном здании, что намекает на тесную связь между фондами и стартапом.
С учетом всех этих данных можно предположить, что DeepSeek получил доступ к мощным вычислительным ресурсам еще до введения санкций США. Это может объяснить, как компании удалось достичь таких впечатляющих результатов.
Как DeepSeek вписывается в стратегию Китая?
Правительство Китая не могло не заметить успех DeepSeek.
20 января 2025 года, в день запуска DeepSeek-R1, Лян Вэньфэн был приглашен на закрытое совещание с премьер-министром Китая Ли Цяном. Это явный сигнал того, что китайские власти рассматривают DeepSeek как стратегически важную компанию.
В последние годы Китай активно стремится к технологическому суверенитету, особенно в сфере ИИ, квантовых вычислений и полупроводников. В условиях санкций США разработка передовых языковых моделей внутри страны становится приоритетом.
Ранее на аналогичные встречи с руководством Китая приглашались такие гиганты, как Baidu. Теперь же DeepSeek официально вошел в число компаний, способных сыграть ключевую роль в технологическом будущем Китая.
Заключение: что ждет DeepSeek дальше?
DeepSeek – это наиболее серьезный вызов, который OpenAI и другим западным разработчикам ИИ бросал Китай за последние годы.
Однако остается ряд открытых вопросов:
- Насколько реалистичны заявления о низкой стоимости обучения?
- Как DeepSeek смог обойти санкции США и получить топовые GPU?
- Насколько устойчивой окажется бизнес-модель компании в долгосрочной перспективе?
Как бы то ни было, игра изменилась. Если DeepSeek действительно научился обучать ИИ с минимальными затратами, это может перевернуть всю индустрию и сделать технологии ИИ доступнее, дешевле и мощнее, чем когда-либо.
А пока Кремниевая долина продолжает спорить о том, возможно ли это вообще, DeepSeek уже меняет правила игры.
Оригинальная статья Reuters:
Eduardo Baptista, “What is DeepSeek and why is it disrupting the AI sector?”
Опубликовано: January 28, 2025
Источник: Reuters