Чому нова ШІ-модель від DeepSeek привернула стільки уваги з боку світових техгігантів. Фото: Depositphotos
Аналітики вважають, що китайський техностартап DeepSeek, чия нова ШІ-модель потіснила навіть ChatGPT від OpenAI, насправді витратила на свою розробку значно більше коштів, ніж заявляє. І це ще не все, чим китайський штучний інтелект привернув увагу техгігантів.
Коли DeepSeek у грудні минулого року випустила свій перший ШІ V3, продуктивність якого могла б перетворити його на конкурента OpenAI та Google, компанія-розробниця зазначила, що інвестувала в проєкт усього $5,6 млн. Це дуже мало в порівнянні з тим, скільки коштів у розробку штучного інтелекту вкладають американські техгіганти. Згодом вийшла модель DeepSeek-R1, яку за продуктивністю порівнюють із найновішою o1 від OpenAI.
Як пише Financial Times, такий бюджет розробки мав би означати, що китайський стартап використав усього 2 048 чипів Nvidia (кількість обмежується експортним контролем США) та обійшов платформу Cuda від Nvidia, яку вважають однією з ключових у розробці штучного інтелекту.
Водночас експерт консалтингової компанії SemiAnalysis Ділан Патель підрахував, що в хедж-фонду High-Flyer (це материнська компанія DeepSeek) насправді є доступ до значно більшої кількості графічних процесорів, на яких навчали попередників DeepSeek-R1. І йдеться про десятки тисяч чипів. Тому Патель вважає, що за стрімким та фіктивним запуском можуть стояти значно більші інвестиції, ніж ті, які озвучує компанія-розробниця. Він припускає, що за весь час роботи над ШІ-моделями тільки на графічні процесори могли витратити понад $500 млн.
Читайте також: ШІ-модель DeepSeek обійшла ChatGPT і обвалила акції техгігантів – що відомо
І це не єдина «претензія» до нового ШІ китайського виробництва. В OpenAI, наприклад, повідомили, що мають підстави вважати, ніби в DeepSeek для навчання R1 використовували запатентовані американським ШІ-розробником моделі. Тобто в компанії Сема Альтмана підозрюють китайського конкурента в порушенні прав на інтелектуальну власність.
А в Meta, що належить Марку Цукербергу, створили чотири команди, які «розберуть DeepSeek-R1 на атоми», щоб зрозуміти, завдяки чому ця модель здатна перевершити своїх американських конкуренток. Ба більше, якщо фахівці Meta розкриють секрети DeepSeek, вони можуть використати стратегії китайського стартапу для покращення власної ШІ-моделі Llama, повідомили в The Information. Дві із чотирьох команд Цукерберга з’ясовуватимуть, як в DeepSeek скоротили витрати на розробку ШІ. Ще одна вивчатиме навчальні дані, на яких тренували модель. Остання досліджуватиме шляхи перепроєктування Llama в такий спосіб, щоби підвищити її здатність до конкуренції.
У Wall Street Journal зазначили, що один із головних ризиків для компаній на кшталт Nvidia полягає в тому, що зростання популярності моделей, як-от DeepSeek-R1, призведе до падіння попиту на чипи, які вони виготовляють. Особливо з огляду на те, що низка техгігантів уже почала створювати власні альтернативи. Втім, як зазначають у виданні, економічний ефект від появи «дешевих» ШІ-моделей визначити складно. За одним із припущень, це навпаки може спричинити сплеск попиту на обчислювальні ресурси, як-от чипи Nvidia.
Айтівець і начальник Управління ІТ Міністерства оборони України Олег Берестовий іде з посади. На цій…
Транснаціональна компанія Visa запустила в Україні технологію, що дозволяє підтверджувати онлайн-покупки за допомогою біометрії –…
Очільник Міністерства цифрової трансформації Михайло Федоров повідомив, скільки податків сплатили резиденти «Дія.City» в І кварталі…
Українські айтівці Влад Кампов та Діма Малєєв запустили власний стартап mentor.sh – платформу для пошуку…
Засновниця та CEO BetterMe Вікторія Рєпа назвала пораду, яку вона хотіла б дати собі 8…
Станіслав Деркач все життя працював у сфері шоубізу, потім кинув собі виклик, пішов у кардинально…