Що таке генеративний штучний інтелект?

Пояснює ШІ експерт Google.

Пропоную вашій увазі переклад піднесенного інтерв’ю з одним із піднесенних гуглерів з простими поясненнями актуальних тем.

Нещодавно було розширено доступ до Bard — експерименту, який дозволяє вам співпрацювати з генеративним ШІ. Bard працює на основі великої мовної моделі, яка є різновидом моделі машинного навчання, що стала відомою завдяки своїй здатності генерувати природну мову. Ось чому її часто називають “генеративний ШІ”. Як і у випадку з будь-якою новою технологією, цілком природно, що у людей виникає багато запитань — наприклад, що саме являє собою генеративний ШІ.

Щоб обговорити поширені питання про генеративний ШІ, великі мовні моделі, машинне навчання та багато іншого, ми зустрілися з Дугласом Екком (Douglas Eck), старшим директором з досліджень в Google. Дуґ не лише працює на передовій ШІ, але й має досвід в дослідженнях літератури та музики. Таке поєднання технічного і творчого ставить його в особливе становище, щоб пояснити, як працює генеративний ШІ та що він може означати для майбутнього технологій і творчості. Ось що він розповів.

Перш ніж ми зануримося в генеративний ШІ, ми повинні поговорити про ШІ в ширшому сенсі. Це один з тих цікавих, але часто досить туманних термінів. Що ж таке штучний інтелект?

ШІ — це широкий термін, який часто використовується для опису всіх видів передових комп’ютерних систем. Я вважаю за краще говорити більш конкретно про “машинне навчання”. Більшість з того, що ми бачимо в ШІ сьогодні, насправді є машинним навчанням: наділення комп’ютерних систем здатністю вчитися на прикладах.

Ми називаємо машини, запрограмовані на навчання на прикладах, “нейронними мережами”. Один з основних способів їхнього навчання — це отримання великої кількості прикладів, на яких вони навчаються, наприклад, коли їм розповідають, що зображено на картинці — ми називаємо це класифікацією (classification). Якщо ми хочемо навчити мережу розпізнавати слона, для цього людина має показати їй багато прикладів того, як виглядає слон, і позначити ці фотографії відповідними тегами. Так модель вчиться відрізняти слона від інших деталей на зображенні.

Мовні моделі — ще один тип нейромереж.

Як працюють мовні моделі?

Мовні моделі зазвичай передбачають, яке слово буде наступним у послідовності слів. Ми тренуємо ці моделі на великих обсягах тексту, щоб вони краще розуміли, яке слово, ймовірно, буде наступним. Один зі способів — але не єдиний — покращити мовну модель — це дати їй більше “прочитати”, тобто навчити її на більшій кількості даних, подібно до того, як ми вчимося на матеріалах, які вивчаємо. Якщо ви почнете вводити фразу “Мері пнула…”, мовна модель, навчена на достатній кількості даних, зможе передбачити: “Мері пнула м’яч”. Без достатнього тренування вона може запропонувати лише “круглий предмет” або лише його колір “жовтий”. Чим більше даних залучено до навчання мовної моделі, тим більш нюансованою вона стає, і тим більше шансів, що вона точно знатиме, що саме Мері, найімовірніше, пнула ногою.

За останні кілька років відбулися значні прориви в тому, як ми досягаємо кращої продуктивності мовних моделей — від масштабування їхнього розміру до зменшення обсягу даних, необхідних для певних завдань.

Мовні моделі вже допомагають людям — наприклад, ви бачите, як вони з’являються в Gmail завдяки функціям Smart Compose та Smart Reply. Мовні моделі також працюють і в Bard.

Зрозуміло. Отже, ми визначилися зі штучним інтелектом і мовними моделями. А як щодо генеративного ШІ?

Генеративна модель може взяти те, чого вона навчилася на прикладах, які їй показували, і створити щось абсолютно нове на основі цієї інформації. Звідси й слово “генеративний”! Великі мовні моделі (Large Language Model, LLMs) є одним із видів генеративного ШІ, оскільки вони генерують нові комбінації тексту у вигляді природної мови. Ми навіть можемо створювати мовні моделі для генерації інших типів вихідних даних, таких як нові зображення, аудіо і навіть відео, як у випадку з Imagen, AudioLM та Phenaki.

Це порушує важливе питання, яке хвилює багатьох людей: Що означає генеративний ШІ для творчих сфер і творчості загалом?

Я вважаю, що у творчій сфері є величезний потенціал — уявіть собі, що ШІ позбавляє людей рутинних завдань, таких як створення чернеток, і не зазіхає на їхню вроджену творчість. Як дослідник музики, я думаю про генеративний ШІ так само, як можна було б думати про появу драм-машини десятиліття тому. Драм-машина генерувала ритм, який відрізнялися від того, що створювали барабанщики-люди, і це дало поштовх розвитку абсолютно нових музичних жанрів.

Як і багато музики з 1980-х років.

Звісно, або як розвивався хіп-хоп у Бронксі з використанням драм-машини. Весь цей жанр розвинувся завдяки цій новій технічній розробці в музиці. Драм-машина не замінила барабанщиків, вона просто додала ще один рівень.

Очевидно, що тут є можливості. Але як щодо потенційних викликів?

Я виростив двох дітей і здобув літературну освіту до того, як зайнявся комп’ютерними науками, тому я ставлю собі реальні запитання про те, як освітяни вимірюють успіх у світі, де генеративний ШІ може написати непогане есе для восьмого чи дев’ятого класу.

Якщо згадати, коли з’явився графічний калькулятор, як вчителі могли дізнатися, чи їхні учні самостійно виконують математичні обчислення? Освіта розвивалася завдяки розумінню того, які інструменти є в розпорядженні учнів, і вимагала від них “показувати свою роботу” новими способами.

Компанії — в тому числі й наша — зобов’язані продумати, для чого ці моделі будуть корисними і як зробити так, щоб це була еволюція, а не руйнування.

Я радий, що ви згадали про відповідальність. Чи можете ви розповісти про те, як Google підходить до розробки машинного навчання?

Ми не поспішаємо і робимо це вдумливо. Якщо ми створюємо продукт, ми хочемо бути впевненими, що він може бути корисним і не завдасть шкоди. У 2018 році ми стали однією з перших компаній, які розробили та опублікували Принципи штучного інтелекту та створили внутрішню структуру управління, щоб слідувати їм. Сьогодні в нашій роботі над ШІ беруть участь група відповідального ШІ Google та багато інших груп, які зосереджені на уникненні упередженості, токсичності та іншої шкоди під час розробки нових технологій.

Я чув, як ви говорили, що ці великі технічні стрибки вже проявляються в маленьких, корисних речах. Але наскільки великим стрибком для суспільства може стати генеративний ШІ?

Зараз ми знаємо, що машини можуть вирішувати прості завдання, такі як класифікація зображень і створення документів. Але я думаю, що ми готові до ще більш амбітних можливостей, таких як розв’язання складних проблем. Сьогодні генеративний ШІ може допомогти вам написати звичайний лист. Завтра він може перебудувати ваші творчі та робочі процеси, щоб звільнити вам час для вирішення абсолютно нових завдань. Завдяки співпраці та експериментам з часом ми відкриємо ще більше переваг генеративного ШІ.

--

--