Как встряска от DeepSeek меняет правила игры на рынке ИИ - Последние новости Казахстана и Алматы

Чтотакое DeepSeek?

Компания DeepSeek Artificial Intelligence Fundamental Technology Research Co., Ltd., была основана в июле 2023 года. Будучи инновационным технологическим стартапом, DeepSeek занимается разработкой передовых больших языковых моделей (LLM) и связанных с ними технологий.

По сообщениям Xinhua, c момента выпуска своей первой модели «DeepSeek LLM» в январе прошлого года компания прошла несколько раундов интеграций. В декабре 2024 года стартап запустил свою открытую модель LLM «V3», которая, по сообщениям американских СМИ, обогнала все открытые модели LLM компании Meta и соперничала с закрытой моделью GPT4-o компании OpenAI.

Новая модель DeepSeek-R1, представленная в январе 2025 года, достигла важного технологического прорыва за счет использования чистых методов глубокого обучения. Другими словами, она позволяет ИИ спонтанно появляться с возможностью «рассуждать».

В отличие от традиционных подходов, таких как Chain-of-Thought (CoT) и Supervised Fine-Tuning (SFT), DeepSeek выделилась в индустрии ИИ, приняв Reinforcement Learning (RL) в качестве основного метода обучения.

В то время как CoT и SFT опираются на пошаговые рассуждения и огромные объемы помеченных данных, RL позволяет моделям учиться, взаимодействуя с окружающей средой, что делает его более подходящим для сложных и динамичных задач.

Внедрение RL позволило стартапу улучшить рассуждения, адаптивность и эффективность своих моделей. Это, собственно, и вывело его на передовые позиции в этой области.

Согласно техническому отчету модели V3, стоимость производства DeepSeek составляет около $5,57 млн, что делает его самым недорогим среди LLM.

Для пользователей, например, модель OpenAI o1 стоит $15 за млн входных токенов и $60 за млн выходных токенов, в то время как DeepSeek-R1 значительно дешевле — $0,55 за млн входных токенов и $2,19 за млн выходных токенов.

Дебют нового искусственного интеллекта вызвал ажиотажную распродажу на фондовом рынке, в результате чего крупные американские технологические компании, включая Nvidia, Broadcom и Oracle, потеряли рынок в размере 1 триллиона долларов всего за 24 часа. Nvidia (NVDA) потеряла 596 млрд.

Кроме того, новая модель DeepSeek-R — это вариант с открытым исходным кодом, в отличие от OpenAI с закрытым исходным кодом и, соответственно, более закрытой экосистемой.

Справочно: Любой код изначально открыт, просто в программах с так называемым закрытым исходным кодом он открыт для ограниченного круга лиц, обычно разработчиков, а в программах с открытым исходным кодом он открыт для неограниченного круга лиц.Особенность открытого кода в том, что любой специалист может самостоятельно скомпилировать исполняемый файл на основе исходного кода и, естественно, посмотреть сам код. Если код закрыт, пользователям предоставляется только исполняемый файл.

Подчеркивая важность развития сотрудничества и инноваций на основе принципов открытого кода, основатель DeepSeek Лян Вэньфэн сказал, что создание надежной технологической экосистемы является приоритетом.

— Мы не будем выбирать закрытый исходный код, — приводит Xinhuaслова основателя компании DeepSeek Лян Вэньфэн.

Кибератаки и защита данных

Несмотря на достижения и быстрый рост популярности, у DeepSeek возникли проблемы. 27 января компания подверглась масштабным кибератакам, в результате которых были введены временные ограничения на регистрацию новых пользователей. Примечательно, что атака произошла в то же время, когда приложение DeepSeek обогнало ChatGPT по количеству загрузок, что вызвало обеспокоенность внутри и за пределами технического сообщества.

Однако на этом проблемы компании не закончились. Исследователи кибербезопасности Wiz недавно обнаружили существенную слабость в системе DeepSeek. Конфиденциальная информация пользователя, такая как история чата, секреты API и особенности серверной части, была обнародована базой данных ClickHouse. Взлом поставил под серьезную угрозу безопасность и конфиденциальность пользователей, предоставив полный контроль над действиями в базе данных без аутентификации.

На этом фоне Конгресс США запретил сотрудникам использовать DeepSeek. Также несколько европейских стран ограничили скачивание приложения, удалив его из AppStore и Google и потребовав у компании предоставить информацию о том, как приложение обрабатывает персональные данные пользователей.

Конкуренция на мировом рынке ИИ

Появление моделей R-1 и Janus-Pro от китайской компании DeepSeek показывает, как может измениться ситуация с технологическим превосходством.

— Похоже, что баланс сил теперь смещается по двум ключевым осям: между США и Китаем, а также между моделями с закрытым и открытым исходным кодом, — приводит The Washington Post мнение экс-генерального директора Google Эрика Шмидта.

По его словам, «это своеобразный момент, когда китайская компания становится фактическим лидером в области открытого исходного кода, в то время как большинство крупных американских компаний, за исключением Meta, продолжают держать свои методологии в строгом секрете. На самом деле это растущая тенденция для китайских ИИ-компаний — от стартапов, таких как Minimax, до технологических гигантов, таких как Alibaba, — которые предоставляют разработчикам по всему миру свободный доступ к своим ИИ-моделям».

Эрик Шмидт отметил, что Соединенные Штаты уже обладают лучшими закрытыми моделями в мире, однако, чтобы оставаться конкурентоспособными, он призвал разработчиков к развитию динамичной экосистемы с открытым исходным кодом.

Он также считает, что «в гонке между ИИ с открытым и закрытым исходным кодом, а также между США и Китаем пока нет явного победителя. Но очевидно, что давление на американских игроков Big Tech будет расти, если DeepSeek сможет конкурировать с ними, используя гораздо меньше ресурсов».

— Путь вперед для американских инноваций включает в себя не только наращивание разработок с открытым исходным кодом, но и поощрение обмена методиками обучения и увеличение инвестиций в исследования и разработки ИИ — примером тому служит недавнее объявление Белым домом проекта Stargate («Звездные врата»), который предполагает потратить $500 млрд на инфраструктуру ИИ в течение следующих четырех лет, — резюмирует Шмидт.

К слову, Премьер Госсовета КНР Ли Цян 20 января в ходе симпозиума, на котором по сообщению издания SCMP в числе группы экспертов в области технологий, образования и науки, присутствовал основатель DeepSeek Лян Вэньфэн, призвал «новые драйверы роста» экономики, созданные благодаря научно-техническим инновациям, помочь «обеспечить и улучшить средства к существованию людей».

А, по данным государственной инвестиционной компании China International Capital Corp (CICC), которые приводит SCMP, к 2030 году объем китайского рынка ИИ составит 5,6 трлн юаней ($765 млрд). По прогнозам CICC, что в течение шести лет с 2025 года в китайскую индустрию искусственного интеллекта может быть инвестировано $1,4 трлн.

Поделиться ссылкой:

Добавить комментарий Отменить ответ