Статті15.03.2023 18:10

Підвчив українську та став розуміти жарти: як отримати доступ до GPT-4

Редактор корисних текстів

Galati, Romania - March 14, 2023: Unveiling GPT-4: OpenAI Announces the Launch of the Groundbreaking Next-Generation AI Language Model

OpenAI представила GPT-4 – останню розробку у лінійці мовних моделей штучного інтелекту. Компанія описує її як більш безпечну, креативну та корисну. А ми вирішили дізнатися, які перспективи використання новинки відкриває перед простими користувачами.

[social_blue social="telegram"]

Редакція MC.today з’ясувала, що таке GPT-4, чому цю модель ШІ називають мультимодальною, чим вона відрізняється від GPT-3.5, які має обмеження і як отримати до неї доступ вже сьогодні.

Зміст

Що таке GPT-4
Історія створення GPT-4
Чим GPT-4 відрізняється від попередників
Обмеження та недоліки GPT-4
Як отримати доступ до GPT-4
Можливості та перспективи

Що таке GPT-4

GPT-4 – це найновіша модель ШІ від компанії OpenAI, яка стала четвертою в лінійці мовних моделей GPT та першою мультимодальною. Це означає, що вона може обробляти як текст, а й інші види інформації, – наприклад, зображення.

«Ось GPT-4, наша найпотужніша і сама узгоджена модель , – написав 14 березня у Twitter генеральний директор OpenAI Сем Альтман. – З цього дня вона доступна в нашому API (зі списком очікування) та у ChatGPT Plus».

Пошукова система Bing

Але, як виявилось, деякі користувачі отримали доступ до нової технології набагато раніше. Корпорація Microsoft підтвердила , що останні версії її пошукової системи Bing таємно працювали з GPT-4 ще до офіційного запуску моделі.

Коли Microsoft запустила новий Bing, ходили чутки про те, що він використовує GPT-4. Тож це складно назвати сенсацією. Цікавий тут інший момент: корпорація не побоялася поставити на карту свою репутацію, а значить, була повністю впевнена в можливостях і перспективах нового дітища OpenAI.

CEO OpenAI Sam Altman / Джерело: Flickr.com

У звіті GPT-4 технічні характеристики моделі не вказані явно. Тому деякі ЗМІ поспішили процитувати чутки про те, що кількість параметрів збільшилася зі 175 млрд. до 100 трлн. Проте сам CEO OpenAI Сем Альтман назвав їх «повною нісенітницею».

«У звичайній розмові різниця між GPT-3.5 і GPT-4 може бути ледь вловимою, – вказує OpenAI в анонсі GPT-4. – Різниця проявляється, коли складність завдання досягає достатнього порога. GPT-4 надійніший, креативніший і здатний обробляти набагато тонші інструкції, ніж GPT-3.5».

GPT-4 здатний розуміти, що відбувається на картинках, хоча в даному випадку це не зовсім просто

Однією з найцікавіших фішок GPT-4 є здатність розуміти зображення. Наприклад, якщо запитати його, що відбувається на картинці вище, він відповість: «чоловік гладить одяг на дошці для прасування, яка прикріплена до даху автомобіля».

Історія створення GPT-4

Модель GPT-4 не з’явилася на порожньому місці. Вона є останнім поколінням сімейства GPT. Абревіатура розшифровується як Generative Pre-trained Transformer – попередньо навчений трансформер для генерації тексту.

Навчання великої мовної моделі

Трансформер тут – не назва фантастичного робота, а архітектура нейронної мережі, яку 2017 року розробили дослідники Google. Саме винахід Трансформера вивів розробку ШІ зі стану застою.

Головна особливість цієї архітектури в її гнучкості, масштабованості та здатності до паралельної обробки даних. Інженери з OpenAI першими довели, що Трансформер можна використовуватиме генерації текстів.

Їхня мовна модель GPT-1 легко перевершила всіх своїх попередників у вмінні працювати з великими обсягами інформації. У 2019 році її змінила GPT-2 з обсягом тренувального датасету в 40 Гб та півтора мільярдами параметрів. А ще через рік з’явилася GPT-3 зі 175 млрд параметрів та збільшеним до 420 Гб обсягом даних.

Інтерфейс ChatGPT

Після додаткового навчання GPT-3 за допомогою зворотного зв’язку від тестерів, мовній моделі надали індекс GPT-3.5. У поєднанні із зручним інтерфейсом вона стала тим самим ChatGPT, який заслужив титул найважливішої інновації XXI століття від Білла Гейтса.

Для навчання GPT-4 інженери OpenAI спільно з платформою хмарних обчислень Microsoft Azure розробили з нуля спеціальний суперкомп’ютер. Знадобилося 6 місяців, щоб з його допомогою навчити GPT-4 на ще більшому наборі даних та налаштувати з урахуванням реального досвіду взаємодії з людьми, який дала експлуатація ChatGPT.

Слід зазначити, що сам собою ChatGPT не є версією мовної моделі. І хоча його часто ототожнюють із GPT-3.5, він виступає лише способом взаємодії з цією моделлю. А тепер у версії Plus це ще й спосіб взаємодії із GPT-4.

Чим GPT-4 відрізняється від попередників

Щоб краще зрозуміти різницю між звичним нам чат-ботом та його вдосконаленою версією, перерахуємо п’ять основних відмінностей між ними.

GPT-4 може розуміти зображення

Мультимодальність дозволяє GPT-4 розуміти більше одного «модального» типу інформації. Усі попередні моделі GPT могли обробляти лише текст. На відміну від них, GPT-4 здатний аналізувати зображення та розуміти, що на них зображено.

GPT-4 знається на гуморі

У поєднанні з логічними здібностями, що зросли, це призводить до дивовижних результатів. Наприклад, GPT-4 не тільки розуміє, що на зображенні зображений величезний роз’єм для iPhone, але може пояснити чому це смішно! Це вражає, бо гумор довго вважали однією з недосяжних для ШІ вершин.

Багатообіцяючою також виглядає співпраця OpenAI з платформою Be My Eyes для незрячих людей. Додаток на основі GPT-4 дозволить сліпим і слабозорим отримати звуковий опис всього, що бачить їх телефон.

Віртуальний помічник визначає вміст холодильника та пропонує на цій основі рецепти

Наприклад, якщо користувач надішле фотографію свого холодильника зсередини, віртуальний помічник зможе визначити, що в ньому знаходиться. Окрім цього він може описати візерунок на сукні, перекласти етикетку, прочитати мапу та пояснити, як дістатися потрібного відділку в магазині.

GPT-4 складніше збити з пантелику

OpenAI провела величезну роботу, щоб зробити GPT-4 безпечнішим. В результаті модель на 82% рідше за попередницю відповідає на запити про заборонений контент. Істотно змінилися на краще також відповіді на делікатні та неоднозначні запити.

Безпека – пріоритет OpenAI

Тим часом можливість того, що GPT-4 може згенерувати шкідливий контент, все одно залишається. Умовно його можна розбити на 5 груп ризику.

Поради, які можуть призвести до самошкідництва.
Переслідування, приниження та ненависть.
Матеріали еротичного характеру.
Інформація, яка може бути корисною для планування нападів чи насильства.
Інструкції щодо пошуку незаконного контенту.

GPT-4 може пам’ятати під час розмови більше тексту

Великі мовні моделі навчалися на мільйонах веб-сторінок. Але, коли ви намагаєтеся ввести в ChatGPT сторінку тексту, може з’ясуватися, що це занадто багато. Аналогічно відповідь чат-бота часто переривається після 4-5 абзацу.

Справа в тому, що існує межа кількості інформації, яку мовна модель може «тримати в умі». До речі, докладніше про це ми писали у статті про інтеграцію GPT-помічника Google Docs.

Для старої версії ChatGPT ця межа складала 4096 токенів. Це приблизно відповідає 8 тис. англійських слів, але в рази менше – при використанні інших мов. Наприклад, в англійській фразі «What is your favorite animal» система виділяє 5 токенів. А в українській фразі «Яка у тебе улюблена тварина» – 31 токен!

У GPT-4 проблема вирішена: максимальна кількість токенів у запиті зросла до 32768. Це приблизно 50 сторінок тексту. Така кількість цілком достатня для змістовної бесіди з ШІ на будь-яку тему.

GPT-4 має покращену багатомовність

Спочатку відповіді ChatGPT англійською були помітно кращі за аналогічні іншими мовами. Тому багато користувачів були змушені робити подвійну роботу: спочатку перекладати запит на англійську, а потім перекладати відповідь з англійської.

GPT-4 вивчив багато мов

GPT-4 зробив у цьому напрямку крок уперед. Тепер відповіді італійською, українською, корейською та ще 26 мовами майже такі ж коректні, як і англійською.

GPT-4 може змінювати свою поведінку на вимогу

Розробники впровадили у GPT-4 розширений інструментарій керованості. Він дозволяє надсилати через API системні повідомлення, які змінюють стиль роботи ШІ, задають тон його відповідей та встановлюють певні сценарії взаємодії з людиною.

GPT-4 може змінювати тон відповідей та сценарії взаємодії з людиною

Наприклад, системне повідомлення може виглядати так: «Ви репетитор, який завжди відповідає в стилі Сократа. Ви ніколи не даєте учню відповіді, але завжди намагаєтеся поставити правильне запитання, щоб допомогти йому навчитися думати самостійно».

Обмеження та недоліки GPT-4

«GPT-4, як правило, не знає про події, що відбулися після вересня 2021 року, і не навчається на своєму досвіді, – пише OpenAI. – Іноді він може робити прості логічні помилки або бути легковірним, приймаючи очевидні помилкові твердження від користувача».

GPT-4 також, як і раніше, має соціальні упередження, схильний до галюцинацій та ворожих підказок. Однак розробники прагнуть розширити можливості участі людей у формуванні моделі та закликають їх активніше оцінювати вдалі та невдалі відповіді ШІ у вікні чату.

Як отримати доступ до GPT-4

Сьогодні є два способи отримати доступ до GPT-4. По-перше, він доступний платним користувачам OpenAI через щомісячну передплату ChatGPT Plus (з обмеженням використання). Вартість послуги $20.

По-друге, розробники можуть зареєструватись у списку очікування для доступу до AP нової мовної моделі. Ціна його використання становить $0,03 за 1 тис. токенів «запиту» (близько 750 англійських слів) та $0,06 за 1 тис. токенів «завершення».

Нагадаємо, що токени запиту – це частини слів, які ви передаєте до GPT-4, а токени завершення – це вміст відповіді GPT-4.

Можливості та перспективи

OpenAI вже співпрацює з низкою компаній, які інтегрували GPT-4 у свої продукти. Наприклад, програма Stripe використовує GPT-4 для сканування сайтів.

GPT-4 – Generative Pre-Trained Transformer model 4

Duolingo вбудував новітню модель ШІ в новий рівень передплати вивчення мов. Morgan Stanley створює систему на основі GPT-4, яка витягуватиме інформацію з документів компанії та надаватиме її фінансовим аналітикам.

Надалі таких програм стане ще більше. А прості користувачі отримають більш потужного і безпечного GPT-асистента, який розуміє жарти, може запам’ятовувати довгі розмови, замінить для дітей репетиторів з будь-якого предмета і стане другими очима для людей з вадами зору.

«Ми сподіваємося, що GPT-4 стане цінним інструментом для покращення життя людей за рахунок підтримки багатьох програм, – пише OpenAI. – Буде ще багато роботи, і ми з нетерпінням чекаємо на можливість покращити цю модель завдяки колективним зусиллям спільноти».