logo
29 Січ 2025

Бюджет розробки, права OpenAI та зацікавленість Meta – чим DeepSeek привернула увагу техгігантів

Юлія Фещенко

Редакторка новин MC.today

Аналітики вважають, що китайський техностартап DeepSeek, чия нова ШІ-модель потіснила навіть ChatGPT від OpenAI, насправді витратила на свою розробку значно більше коштів, ніж заявляє. І це ще не все, чим китайський штучний інтелект привернув увагу техгігантів.

Програміст, DeepSeek, колажЧому нова ШІ-модель від DeepSeek привернула стільки уваги з боку світових техгігантів. Фото: Depositphotos

Коли DeepSeek у грудні минулого року випустила свій перший ШІ V3, продуктивність якого могла б перетворити його на конкурента OpenAI та Google, компанія-розробниця зазначила, що інвестувала в проєкт усього $5,6 млн. Це дуже мало в порівнянні з тим, скільки коштів у розробку штучного інтелекту вкладають американські техгіганти. Згодом вийшла модель DeepSeek-R1, яку за продуктивністю порівнюють із найновішою o1 від OpenAI.

Як пише Financial Times, такий бюджет розробки мав би означати, що китайський стартап використав усього 2 048 чипів Nvidia (кількість обмежується експортним контролем США) та обійшов платформу Cuda від Nvidia, яку вважають однією з ключових у розробці штучного інтелекту. 

Водночас експерт консалтингової компанії SemiAnalysis Ділан Патель підрахував, що в хедж-фонду High-Flyer (це материнська компанія DeepSeek) насправді є доступ до значно більшої кількості графічних процесорів, на яких навчали попередників DeepSeek-R1. І йдеться про десятки тисяч чипів. Тому Патель вважає, що за стрімким та фіктивним запуском можуть стояти значно більші інвестиції, ніж ті, які озвучує компанія-розробниця. Він припускає, що за весь час роботи над ШІ-моделями тільки на графічні процесори могли витратити понад $500 млн.

Читайте також: ШІ-модель DeepSeek обійшла ChatGPT і обвалила акції техгігантів – що відомо

І це не єдина «претензія» до нового ШІ китайського виробництва. В OpenAI, наприклад, повідомили, що мають підстави вважати, ніби в DeepSeek для навчання R1 використовували запатентовані американським ШІ-розробником моделі. Тобто в компанії Сема Альтмана підозрюють китайського конкурента в порушенні прав на інтелектуальну власність.

А в Meta, що належить Марку Цукербергу, створили чотири команди, які «розберуть DeepSeek-R1 на атоми», щоб зрозуміти, завдяки чому ця модель здатна перевершити своїх американських конкуренток. Ба більше, якщо фахівці Meta розкриють секрети DeepSeek, вони можуть використати стратегії китайського стартапу для покращення власної ШІ-моделі Llama, повідомили в The Information. Дві із чотирьох команд Цукерберга з’ясовуватимуть, як в DeepSeek скоротили витрати на розробку ШІ. Ще одна вивчатиме навчальні дані, на яких тренували модель. Остання досліджуватиме шляхи перепроєктування Llama в такий спосіб, щоби підвищити її здатність до конкуренції.

У Wall Street Journal зазначили, що один із головних ризиків для компаній на кшталт Nvidia полягає в тому, що зростання популярності моделей, як-от DeepSeek-R1, призведе до падіння попиту на чипи, які вони виготовляють. Особливо з огляду на те, що низка техгігантів уже почала створювати власні альтернативи. Втім, як зазначають у виданні, економічний ефект від появи «дешевих» ШІ-моделей визначити складно. За одним із припущень, це навпаки може спричинити сплеск попиту на обчислювальні ресурси, як-от чипи Nvidia.

  • Нагадаємо, раніше цього тижня DeepSeek обмежила реєстрацію нових користувачів попри зростання популярності через кібератаку, якої зазнали її сервіси.

Спецпроекти

Ваша жалоба отправлена модератору

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: