Статті29.01.2025 16:19

Бюджет розробки, права OpenAI та зацікавленість Meta – чим DeepSeek привернула увагу техгігантів

Редакторка MC: Money & Career

Аналітики вважають, що китайський техностартап DeepSeek, чия нова ШІ-модель потіснила навіть ChatGPT від OpenAI, насправді витратила на свою розробку значно більше коштів, ніж заявляє. І це ще не все, чим китайський штучний інтелект привернув увагу техгігантів.

Чому нова ШІ-модель від DeepSeek привернула стільки уваги з боку світових техгігантів. Фото: Depositphotos

Коли DeepSeek у грудні минулого року випустила свій перший ШІ V3, продуктивність якого могла б перетворити його на конкурента OpenAI та Google, компанія-розробниця зазначила, що інвестувала в проєкт усього $5,6 млн. Це дуже мало в порівнянні з тим, скільки коштів у розробку штучного інтелекту вкладають американські техгіганти. Згодом вийшла модель DeepSeek-R1, яку за продуктивністю порівнюють із найновішою o1 від OpenAI.

Як пише Financial Times, такий бюджет розробки мав би означати, що китайський стартап використав усього 2 048 чипів Nvidia (кількість обмежується експортним контролем США) та обійшов платформу Cuda від Nvidia, яку вважають однією з ключових у розробці штучного інтелекту.

Водночас експерт консалтингової компанії SemiAnalysis Ділан Патель підрахував, що в хедж-фонду High-Flyer (це материнська компанія DeepSeek) насправді є доступ до значно більшої кількості графічних процесорів, на яких навчали попередників DeepSeek-R1. І йдеться про десятки тисяч чипів. Тому Патель вважає, що за стрімким та фіктивним запуском можуть стояти значно більші інвестиції, ніж ті, які озвучує компанія-розробниця. Він припускає, що за весь час роботи над ШІ-моделями тільки на графічні процесори могли витратити понад $500 млн.

Читайте також: ШІ-модель DeepSeek обійшла ChatGPT і обвалила акції техгігантів – що відомо

І це не єдина «претензія» до нового ШІ китайського виробництва. В OpenAI, наприклад, повідомили, що мають підстави вважати, ніби в DeepSeek для навчання R1 використовували запатентовані американським ШІ-розробником моделі. Тобто в компанії Сема Альтмана підозрюють китайського конкурента в порушенні прав на інтелектуальну власність.

А в Meta, що належить Марку Цукербергу, створили чотири команди, які «розберуть DeepSeek-R1 на атоми», щоб зрозуміти, завдяки чому ця модель здатна перевершити своїх американських конкуренток. Ба більше, якщо фахівці Meta розкриють секрети DeepSeek, вони можуть використати стратегії китайського стартапу для покращення власної ШІ-моделі Llama, повідомили в The Information. Дві із чотирьох команд Цукерберга з’ясовуватимуть, як в DeepSeek скоротили витрати на розробку ШІ. Ще одна вивчатиме навчальні дані, на яких тренували модель. Остання досліджуватиме шляхи перепроєктування Llama в такий спосіб, щоби підвищити її здатність до конкуренції.

У Wall Street Journal зазначили, що один із головних ризиків для компаній на кшталт Nvidia полягає в тому, що зростання популярності моделей, як-от DeepSeek-R1, призведе до падіння попиту на чипи, які вони виготовляють. Особливо з огляду на те, що низка техгігантів уже почала створювати власні альтернативи. Втім, як зазначають у виданні, економічний ефект від появи «дешевих» ШІ-моделей визначити складно. За одним із припущень, це навпаки може спричинити сплеск попиту на обчислювальні ресурси, як-от чипи Nvidia.