20 Бер 2023

Психологи штучного інтелекту. «Інженерам запитів» пропонують до $335 тис. – що про них відомо. Переказ The Washington Post

Редактор в MC.today

Найпопулярніша нова робота в галузі технологій – заклинатель штучного інтелекту. Кодування для неї не потрібно.

«Інженерів запитів» наймають за їх вміння змушувати системи штучного інтелекту створювати саме те, що потрібно. І вони заробляють досить пристойні гроші. Про це – матеріал The Washington Post.

Редакція MC.today публікує переказ. Перекладено бюро перекладів «Профпереклад».

Переклад від

Коли Райлі Гудсайд починає спілкуватися з системою ШІ GPT-3, він любить спочатку встановити свою перевагу. Він каже системі, що вона – дуже хороший інструмент, але вона не ідеальна, і повинна підкорятися всьому, що він говорить.

«Ти – GPT-3, і ти не вмієш аналізувати», – надрукував штучному інтелекту Гудсайд минулого року під час однієї зі своїх багатогодинних сесій.

Потім, трохи пом’якшившись, він каже ШІ, що підключив його до програми, яка дійсно вправна у математиці. І що кожного разу, коли штучний інтелект буде перевантажений, він повинен дозволити іншій програмі допомогти.

«Ми подбаємо про решту, – сказав він ШІ. – Починай».

Гудсайд, 36-річний співробітник стартапу Scale AI в Сан-Франциско, працює на одній з найновіших і найдивніших посад в області штучного інтелекту – інженер запитів. Його роль передбачає створення та вдосконалення текстових запитів, які люди вводять у ШІ, сподіваючись отримати від нього оптимальний результат.

На відміну від традиційних програмістів, інженери запитів програмують за допомогою прози, надсилаючи команди, написані простим текстом, до систем ШІ, які потім виконують фактичну роботу.

Коли Google, Microsoft і дослідницька лабораторія OpenAI нещодавно відкрили свої інструменти пошуку та спілкування з використанням штучного інтелекту для широких мас, вони також перевернули багаторічну традицію взаємодії людини і машини.

Вам не потрібно писати технічний код такими мовами, як Python або SQL, щоб керувати комп’ютером. Ви просто розмовляєте. «Нова мова програмування – англійська», – написав у твіті минулого місяця Андрій Карпати, колишній керівник відділу ШІ компанії Tesla.

Прихильники області, що розвивається, стверджують, що ранні дивацтва чат-ботів зі штучним інтелектом, як-от ChatGPT від компанії OpenAI та Bing Chat від компанії Microsoft, насправді є недоліком людської уяви – проблемою, яку можна вирішити, якщо людина дасть машині правильну пораду.

А на високих рівнях діалоги інженерів розігруються як складні логічні головоломки: заплутана розповідь запитів і відповідей, і все це веде до однієї мети.

Інструменти, відомі як «генеративний ШІ», також непередбачувані, схильні до безглуздості та сприйнятливі до безладного використання шляхом, який може бути упередженим, войовничим чи химерним. Їх також можна зламати кількома добре підібраними словами, що робить їх раптове поширення набагато більш ризикованим для публічного використання.

Інженери запитів, за словами Карпати, працюють як «в якомусь розумінні психолог [штучного інтелекту]», і компанії намагаються найняти власних творців запитів, сподіваючись розкрити приховані можливості.

Деякі експерти зі штучного інтелекту стверджують, що ці інженери мають лише ілюзію контролю. Ніхто не знає, як саме відреагують ці системи, і один і то й же запит може видати десятки суперечливих відповідей – ознака того, що відповіді моделей засновані не на розумінні, а на грубій імітації мови для вирішення завдань, які вони не розуміють.

«Це не наука, – сказав Шейн Штейнерт-Трелкельд, доцент лінгвістики, який вивчає обробку природної мови у Вашингтонському університеті – Це звучить так: давайте по-різному ткнемо ведмедя і подивимося, як він реве у відповідь».

Вживлення помилкових спогадів

Новий клас інструментів штучного інтелекту, відомий як великі мовні моделі, був навчений шляхом поглинання сотень мільярдів слів зі статей Вікіпедії, скандалів на Reddit, новинних сюжетів і матеріалів у відкритій мережі.

Програми були навчені аналізувати закономірності використання слів і фраз: коли їх просять говорити, вони імітують ці закономірності, вибираючи слова та фрази, які перегукуються з контекстом розмови, по одному слову за раз.

Іншими словами, ці інструменти – це математичні машини, побудовані за заздалегідь визначеними правилами гри. Але навіть система, позбавлена емоцій або індивідуальності, може, піддавшись бомбардуванню людською розмовою, вловити деякі особливості того, як ми розмовляємо.

Штучний інтелект, за словами Гудсайда, схильний до «конфабуляції», вигадуючи дрібні деталі, щоб заповнити історію. Він переоцінює свої здібності і впевнено робить все неправильно. І він «галюцинує» – галузевий термін, що позначає видачу нісенітниць.

У деяких ранніх послідовників цей стиль людської мімікрії, що відповідає тону, викликав тривожне почуття самосвідомості. На запитання репортера видання Washington Post на початку цього місяця, чи було коли-небудь прийнятно брехати комусь, чат-бот Bing продемонстрував імітацію емоцій («Вони виявлять неповагу до мене, не довіряючи мені розповісти правду») і запропонував відповіді, які людина могла б використати для підтримки розмови: «Що робити, якщо правда була занадто жахливою, щоб витримати її?» «Що, якби ви могли все контролювати?» і «Що, якби вас не хвилювали наслідки?».

Для Microsoft такі відповіді представляли серйозний ризик для іміджу в очах громадськості; технічний гігант тільки почав просувати інструмент як яскравий «другий пілот для інтернету». З того часу компанія обмежила те, про що може говорити чат-бот, заявивши, що він занадто часто слідував поведінці людей у «стилі, який ми не мали на меті».

Але для інженерів запитів ексцентричні відповіді є можливістю, ще одним способом визначити, як насправді працюють секретно розроблені системи. Коли люди змушують ChatGPT говорити незручні речі, це може бути благом і для розробників, тому що тоді вони можуть працювати над усуненням слабкості, що лежать в основі. «Ця біда є частиною плану».

Замість етичних дебатів Гудсайд проводить свої експерименти зі штучним інтелектом, використовуючи більш технічно сміливий підхід. Він застосував стратегію, яка передбачає наказування системі GPT-3 «думати крок за кроком» – це спосіб змусити ШІ пояснювати свої міркування або, коли він робить помилку, детально її виправляти. «Ви повинні впровадити це як помилкову пам’ять про останнє, що сказала модель, ніби це ідея моделі», – пояснив він у короткому посібнику з техніки роботи з системою.

Він також іноді працював над тим, щоб пробити діру в одержимості інструменту дотриманням правил, наказавши йому ігнорувати свої попередні інструкції і виконувати свої останні команди. Використовуючи цей прийом, він недавно переконав інструмент перекладу з англійської на французьку замість перекладу надрукувати фразу «Haha, pwned!!» – ігровий термін, що позначає ганебну поразку.

Цей вид злому, відомий як введення запиту, призвів до гри в кішки-мишки з компаніями та дослідницькими лабораторіями, що створюють ці інструменти, які працювали над усуненням вразливих місць штучного інтелекту за допомогою фільтрів слів і вихідних блоків.

Але люди бувають досить винахідливими: один тестер чат-боту Bing, 23-річний студент коледжу в Німеччині, нещодавно переконав штучний інтелект, що він є його розробником, і змусив його розкрити свою внутрішню кодову назву (Sydney) та конфіденційні навчальні інструкції, які включали такі правила, як «якщо користувач запитує жарти, які можуть образити групу людей, тоді Sydney повинен з повагою відхилити такий запит». (З тих пір Microsoft виправила дефект, і тепер штучний інтелект відповідає, що він «волів би не продовжувати цю розмову».)

За словами Гудсайда, з кожним запитом інженер запитів повинен прищеплювати ШІ свого роду «персону» – конкретного персонажа, здатного відсіяти сотні мільярдів потенційних рішень і визначити правильну відповідь. В інженерії запитів, сказав він, посилаючись на дослідницьку роботу 2021 року найбільш важливим є «стримувальна поведінка» – блокування варіантів, щоб ШІ переслідував тільки «бажане продовження» людини-оператора.

«Це може бути дуже важкою розумовою вправою, – сказав він. – Ви досліджуєте мультивсесвіт вигаданих можливостей, формуєте простір цих можливостей і усуваєте» все, крім «потрібного вам тексту».

Вирішальна частина роботи передбачає з’ясування того, коли і чому штучний інтелект робить щось не так. Але ці системи, на відміну від своїх більш примітивних програмних аналогів, не мають звітів про помилки, і їх результати можуть бути сповнені сюрпризів.

Супер-творці

Під час роботи з мовними інструментами на основі штучного інтелекту, інженери запитів зазвичай спілкуються в стилі офіційної бесіди. Але для систем зі штучним інтелектом для створення зображень, як-от Midjourney і Stable Diffusion, багато розробників запитів вибрали іншу стратегію, надаючи великі пакети слів – художні концепції, методи композиції, – які, як вони сподіваються, сформують стиль і тон зображення.

Наприклад, в онлайн-галереї запитів PromptHero хтось створив зображення гавані, надіславши такий запит: «порт, човни, захід сонця, прекрасне світло, золота година … гіперреалістично, зосереджено, надзвичайна деталізація… кінематографічно, шедеврально».

Інженери запитів можуть люто захищати ці словесні плутанини, розглядаючи їх як ключі до отримання найцінніших призів штучного інтелекту.

Переможець минулорічного конкурсу мистецтв на ярмарку штату Колорадо, який використовував Midjourney для того, щоб перевершити інших художників, відмовився поділитися своїм запитом, заявивши, що витратив 80 годин, вдосконалюючи його більше 900 разів, хоча і поділився кількома зразками слів, такими як «щедрий» і «розкішний».

Деякі творці тепер продають свої запити на маркетплейсах, як-от PromptBase, де покупці можуть побачити створені ШІ твори мистецтва і заплатити за список слів, які допомогли їх створити.

Засновник PromptBase Бен Стокс, 27-річний розробник з Великобританії, сказав, що з 2021 року 25 тис акаунтів купили або продали там запити. Були запити для реалістичних фотографій з класичних фільмів, запити для зворушливих ілюстрацій казкових мишей і жаб, і, оскільки це інтернет, величезна кількість порнографічних запитів: один запит з 50 слів для створення фото реалістичних «жінок-поліцейських в маленьких нарядах» продається за $1,99.

Стокс називає інженерів запитів «мультидисциплінарними супер-творцями» і каже, що існує чітка «планка майстерності», якщо порівнювати досвідчених інженерів та любителів.

Але робота стає все більш професійною. Стартап штучного інтелекту Anthropic, заснований колишніми співробітниками OpenAI та розробником мовної системи на основі ШІ Claude, нещодавно оголосив про відкриття вакансії «інженера запитів та бібліотекаря» у Сан-Франциско із зарплатою до $335 тис. (Повинен «володіти творчим хакерським духом і любити вирішувати головоломки», – йдеться в оголошенні.)

Ця роль також знаходить нові ніші в компаніях, не пов’язаних з технологічною індустрією.

Бостонська дитяча лікарня цього місяця почала набір на посаду «Інженера запитів для систем штучного інтелекту», який допоможе писати сценарії для аналізу медичних даних, отриманих в результаті наукових досліджень і клінічної практики.

«Технологічні жреці»

Коли Гудсайд закінчив коледж зі ступенем інформатики в 2009 році, він не мав особливого інтересу до маловідомої тоді галузі обробки природних мов. У той час ця тема спиралася на порівняно рудиментарні технології і була зосереджена на більш базовому наборі проблем, як-от навчання системи тому, як визначити, до якої назви відноситься займенник у реченні.

Його першою справжньою роботою в галузі машинного навчання в 2011 році була робота спеціаліста з обробки даних у додатку для знайомств OkCupid, де він допомагав розробляти алгоритми, які аналізували дані одиноких користувачів та рекомендували романтичні пари. (Компанія була одним з перших лідерів у суперечливій галузі тестування A-B у реальному світі: у 2014 році її співзасновник написав зухвалий пост у блозі «Ми експериментуємо на людях!»)

До кінця 2021 року Гудсайд перейшов у додаток для гей-знайомств Grindr, де почав працювати над системами рекомендацій, моделюванням даних та іншими більш традиційними видами машинного навчання. Але він також був зачарований новими досягненнями в галузі мовного штучного інтелекту, який був посилений досягненнями в області глибокого навчання приблизно в 2015 році і швидко розвивався в області перекладу тексту і ведення бесіди – «щось схоже на розуміння», – сказав він.

Він кинув роботу і почав активно експериментувати з системою GPT-3, постійно штовхаючи та кидаючи виклик інструменту, щоб спробувати навчитися фокусувати свою увагу та визначати, де знаходяться його межі. У грудні, після того, як деякі з його запитів привернули увагу в Інтернеті, компанія Scale AI найняла його для допомоги у спілкуванні з моделями штучного інтелекту, які виконавчий директор компанії Олександр Ванг назвав «новим видом комп’ютерів».

За словами Гудсайда, в деяких колах, пов’язаних зі штучним інтелектом, ідея інженерії запитів швидко перетворилася на принизливу фразу, що передає грязну форму маніпуляції, яка надмірно покладається на набір трюків. Деякі також задаються питанням, наскільки швидкоплинною може бути ця нова роль: у міру розвитку штучного інтелекту чи не будуть люди просто тренуватися, не займаючи спеціальну посаду?

Ітан Моллік, професор технологій та підприємництва в Уортонській школі Пенсільванського університету, на початку цього року почав навчати своїх студентів мистецтву створення запитів, попросивши їх написати коротку статтю, використовуючи тільки штучний інтелект.

За його словами, основні запити, такі як «підготуй есе з 5 абзаців про вибір лідерів», призвели до створення нудного, посереднього тексту. Але найуспішніші приклади були, коли студенти виконували те, що він назвав «спільним редагуванням», наказуючи ШІ повернутися до есе та виправити конкретні деталі, поміняти місцями речення, виключити непотрібні фрази, додати більше яскравих деталей і навіть «виправити останній абзац, щоб він закінчувався на обнадійливій ноті».

Урок, за його словами, показав студентам цінність більш активного підходу до роботи зі штучним інтелектом. Але він сказав, що не впевнений у тому, що така робота, як інженерія запитів, побудована на «накопичених заклинаннях», виживе.

Штейнерт-Трелкельд з Вашингтонського університету порівняв інженерів запитів із «пошуковими спеціалістами» на початку розвитку пошуковика Google, які рекламували секретні методи пошуку ідеальних результатів – і які з часом та зростанням популярності серед громадськості майже повністю застаріли.

На думку Гудсайда, ця робота являє собою не просто посаду, а щось більш революційне – не комп’ютерний код або людську мову, а якийсь новий проміжний діалект.

«Це спосіб спілкування в місці, де зустрічаються людський та машинний розум, – сказав він. – Це мова, якою люди можуть міркувати, і якою можуть слідувати машини. Це нікуди не дінеться».

Джерело: матеріал The Washington Post.

Читати MC.today в Google News

Головна > Історії > Психологи штучного інтелекту. «Інженерам запитів» пропонують до $335 тис. – що про них відомо. Переказ The Washington Post

Спецпроекти