Рубріки: ITІнфопривід

Бюджет розробки, права OpenAI та зацікавленість Meta – чим DeepSeek привернула увагу техгігантів

Аналітики вважають, що китайський техностартап DeepSeek, чия нова ШІ-модель потіснила навіть ChatGPT від OpenAI, насправді витратила на свою розробку значно більше коштів, ніж заявляє. І це ще не все, чим китайський штучний інтелект привернув увагу техгігантів.

Коли DeepSeek у грудні минулого року випустила свій перший ШІ V3, продуктивність якого могла б перетворити його на конкурента OpenAI та Google, компанія-розробниця зазначила, що інвестувала в проєкт усього $5,6 млн. Це дуже мало в порівнянні з тим, скільки коштів у розробку штучного інтелекту вкладають американські техгіганти. Згодом вийшла модель DeepSeek-R1, яку за продуктивністю порівнюють із найновішою o1 від OpenAI.

Як пише Financial Times, такий бюджет розробки мав би означати, що китайський стартап використав усього 2 048 чипів Nvidia (кількість обмежується експортним контролем США) та обійшов платформу Cuda від Nvidia, яку вважають однією з ключових у розробці штучного інтелекту. 

Водночас експерт консалтингової компанії SemiAnalysis Ділан Патель підрахував, що в хедж-фонду High-Flyer (це материнська компанія DeepSeek) насправді є доступ до значно більшої кількості графічних процесорів, на яких навчали попередників DeepSeek-R1. І йдеться про десятки тисяч чипів. Тому Патель вважає, що за стрімким та фіктивним запуском можуть стояти значно більші інвестиції, ніж ті, які озвучує компанія-розробниця. Він припускає, що за весь час роботи над ШІ-моделями тільки на графічні процесори могли витратити понад $500 млн.

Читайте також: ШІ-модель DeepSeek обійшла ChatGPT і обвалила акції техгігантів – що відомо

І це не єдина «претензія» до нового ШІ китайського виробництва. В OpenAI, наприклад, повідомили, що мають підстави вважати, ніби в DeepSeek для навчання R1 використовували запатентовані американським ШІ-розробником моделі. Тобто в компанії Сема Альтмана підозрюють китайського конкурента в порушенні прав на інтелектуальну власність.

А в Meta, що належить Марку Цукербергу, створили чотири команди, які «розберуть DeepSeek-R1 на атоми», щоб зрозуміти, завдяки чому ця модель здатна перевершити своїх американських конкуренток. Ба більше, якщо фахівці Meta розкриють секрети DeepSeek, вони можуть використати стратегії китайського стартапу для покращення власної ШІ-моделі Llama, повідомили в The Information. Дві із чотирьох команд Цукерберга з’ясовуватимуть, як в DeepSeek скоротили витрати на розробку ШІ. Ще одна вивчатиме навчальні дані, на яких тренували модель. Остання досліджуватиме шляхи перепроєктування Llama в такий спосіб, щоби підвищити її здатність до конкуренції.

У Wall Street Journal зазначили, що один із головних ризиків для компаній на кшталт Nvidia полягає в тому, що зростання популярності моделей, як-от DeepSeek-R1, призведе до падіння попиту на чипи, які вони виготовляють. Особливо з огляду на те, що низка техгігантів уже почала створювати власні альтернативи. Втім, як зазначають у виданні, економічний ефект від появи «дешевих» ШІ-моделей визначити складно. За одним із припущень, це навпаки може спричинити сплеск попиту на обчислювальні ресурси, як-от чипи Nvidia.

  • Нагадаємо, раніше цього тижня DeepSeek обмежила реєстрацію нових користувачів попри зростання популярності через кібератаку, якої зазнали її сервіси.

Нещодавні статті

Менторство і допомога із пошуком фінансування. В Україні запускають мережу стартап-шкіл

В Україні запускають мережу стартап-шкіл – інкубаторів – акселераторів на базі вишів і наукових установ.…

15/05/2025

Підняли рівень, пробили мовні бар’єри, навчаємо далі. Кейс про співпрацю військових зі школою англійської

Коли військовій школі «Боривітер» знадобились курси англійської, вона звернулась до Yappi Corporate із чітким запитом.…

15/05/2025

«Мета – створити сильні та сталі громади». Як MISTO змінює взаємодію між містами та мешканцями – Олег Половинко

«Децентралізація показала, що справжня сила зосереджена в громадах. Вони стали основою місцевого управління, але часто…

15/05/2025

ІТ – в топі. У яких галузях найчастіше пропонують роботу українським студентам

ІТ-галузь увійшла в пʼятірку перших робіт, які пропонують українським студентам. За даними сервісу robota.ua, на…

14/05/2025

Airbnb виходить за межі оренди – платформа додала можливість наймати профільних фахівців

На платформі короткострокової оренди житла Airbnb запустили нову послугу, яка тепер дозволяє користувачам викликати місцевих…

14/05/2025

Гранти, консультації і не тільки. В Україні запускають проєкт підтримки технологічних бізнесів

Український фонд стартапів (USF), «Дія.Бізнес» та «Дія.City» запускають проєкт для технологічних бізнесів. Він має допомогти…

14/05/2025