Гірка правда ШІ: він теж має власні упередження

Ілюстрація виконана Tactical Tech, з візуальними елементами від Йоргоса Багакіса та Алессандро Кріпсти. Використано з дозволу.

Стаття написана Сафою Гнаїм у співпраці з Ґете-Інститутом у Бразилії і вперше була опублікована на сайті DataDetoxKit.org. Відредагована версія перевидана Global Voices на підставі угоди про партнерство. 

Хоч на перший погляд штучний інтелект (ШІ) може здатися “нейтральною технологією”, він також має свої упередження. Це зовсім не той об'єктивний інструмент, яким його багато хто вважає. Річ у тім, що ШІ розробляється людьми і навчається на певних наборах даних. Люди, які створюють ШІ, як і всі ми, мають свої переконання, думки та досвід, що впливають на їхній вибір, усвідомлюють вони це чи ні. Інженери та компанії, які розробляють і навчають ШІ, можуть вважати певну інформацію або цілі важливішими за інші. Залежно від того, які набори даних “згодовують” інструментам ШІ — наприклад, алгоритмам або чат-ботам — машини можуть видавати упереджені результати. Саме тому ШІ здатен генерувати неточну інформацію, хибні припущення або приймати невдалі рішення, зовсім як звичайна людина.

Не магія, а програмування: як людські недоліки передаються ШІ

Дехто говорить про ШІ так, наче це якась магія, але насправді штучний інтелект — це всього лише машина. Простіше кажучи, інструменти ШІ — це комп'ютерні програми, яким “згодували” багато даних, щоб вони могли робити прогнози. Під “ШІ” розуміють різноманітні інструменти, розроблені для розпізнавання закономірностей, вирішення проблем і прийняття рішень зі значно більшою швидкістю та в масштабах, непідвладних людині.

Але як і будь-який інструмент, ШІ розробляється та програмується людьми. Саме творці цих машин задають їм правила, яких ті мають дотримуватися: “роби це, але не роби того”. Знаючи, що інструменти ШІ є автоматизованими системами з власними, людськими за походженням обмеженнями, можна з більшою впевненістю говорити про можливості та недоліки штучного інтелекту.

Говорячи про штучний інтелект, люди можуть мати на увазі різне. Ось кілька прикладів найбільш популярних інструментів ШІ та їхніх недоліків:

Інструменти для генерації тексту створюють контент на основі певних заданих вами ключових слів (або «підказок»). Такі програми навчаються на великих обсягах тексту різної якості з Інтернету. Їх називають «великими мовними моделями» (ВММ) або окремими назвами таких продуктів, як ChatGPT, чи навіть більш неформальними термінами на кшталт «чат-боти» або «асистенти ШІ». Незважаючи на те, що ці інструменти, як відомо, можуть досягати результатів, властивих людському інтелекту, наприклад, успішно складати іспити, вони також можуть «галюцинувати», тобто генерувати текст, який є недостовірним.

Інструменти генерації зображень створюють зображення та відео на основі заданих ключових слів. Їх ще називають моделями перетворення тексту в зображення та окремими назвами продуктів, як-от DALL-E або Stable Diffusion. Ці технології можуть створювати неймовірно правдоподібні зображення та відео, але також відомі тим, що обмежують дійсність стереотипами та можуть бути використані для шантажу й домагання.

Рекомендаційні системи пропонують вам контент, на який, за їхніми прогнозами, ви, найімовірніше, натиснете або з яким будете взаємодіяти. Такі програми працюють у фоновому режимі в пошукових системах, стрічках соціальних мереж та автоматичному відтворенні на YouTube. Інколи їх ще називають алгоритмами. Дані інструменти можуть дати вам більше інформації про те, що вас вже цікавить, а також можуть підштовхнути вас до певних небезпечних пасток. Рекомендаційні системи застосовуються при ухваленні важливих рішень, таких як працевлаштування, зарахування на навчання, надання кредитів на житло та в інших сферах повсякденного життя.

В той час як деякі експерти вважають, що інструменти ШІ, такі як чат-боти, стають «розумнішими» самі по собі, інші кажуть, що ці інструменти допускають багато помилок. Ось кілька причин, чому варто задуматися про упередження , що стоять за ШІ:

  • Деякі дані, на яких вони навчаються, можуть бути особистою інформацією, захищені авторським правом або використовуватися без дозволу.
  • Залежно від набору даних, вони можуть містити мову ворожнечі, теорії змови або просто неправдиву інформацію.
  • Дані можуть містити упереджене ставлення до певних груп людей на основі їхньої статі, культури, віросповідання, професії чи життєвих обставин.

ШІ також навчається на даних, які цілком відкидають певну інформацію. Якщо в навчальному матеріалі мало або зовсім немає інформації про якусь групу людей, мову чи культуру, система не зможе згенерувати про це відповіді. У 2018 році Джой Буоламвіні (Joy Buolamwini) провела знакове дослідження під назвою «Гендерні відтінки». Воно показало, як системи розпізнавання облич не в змозі ідентифікувати обличчя осіб з різним кольором шкіри, насамперед, це стосується темношкірих жінок. На момент проведення дослідження ці недосконалі інструменти регулярно використовувалися у практиці роботи поліції Сполучених Штатів.

Виявляйте упередження, щоб не відтворювати їх

Знаючи про можливі недоліки у масивах даних ШІ, створених такими ж людьми, як ми, тепер погляньмо на самих себе. Яким чином спосіб мислення людини може вплинути на упередженість штучного інтелекту?

Існують види упереджень, що глибоко вкорінені в свідомості окремих людей, організаціях, культурах і суспільствах. Зверніть увагу на них, поміркувавши над наступними питаннями:

  • Що ви вважаєте «нормою» в поведінці, мовленні та зовнішньому вигляді інших?
  • Чи є групи, які стикаються з більшим ризиком, засудженням або дискримінацією через те, як вони виглядають, поводяться, одягаються чи говорять?

Те, про що ви зараз думали, часто ґрунтується на припущеннях, установках і стереотипах, які були частиною культур упродовж дуже тривалого часу. Вони впливають на ваше ухвалення рішень, навіть якщо ви цього не усвідомлюєте. Ось чому їх називають “неявними упередженнями” — вони часто вбудовані у ваш спосіб мислення, їх важко виявити і ще складніше з ними боротися.

До таких неявниї упереджень належать:

  • Гендерні упередження: схильність робити поспішні висновки щодо людей різної статі на основі упередженості або стереотипів.
  • Расові та/або етнічні упередження: схильність робити поспішні висновки щодо людей на основі кольору їхньої шкіри, культурного походження та/або етнічної приналежності.

Гарвард має величезне зібрання тестів на виявлення неявних упереджень, які можна безкоштовно пройти онлайн, аби зрозуміти, яким чином ви справляєтеся з цим завданням і над чим варто попрацювати. З огляду на велику кількість неявних упереджень, може здаватися, що навіть виявлення цих переконань – нелегка справа. Навряд чи це вдасться одразу, однак чому б не розпочати вже зараз?

Під мікроскопом ШІ

Ознайомившись із поширеними прикладами таких шаблонів мислення та неявних упереджень, спробуйте уявити, як це може виглядати в набагато більших масштабах. Такі схеми мислення та неявні упередження можуть впливати нне лише на окремих осіб, а й на цілі групи людей, особливо коли вони «закодовані» в комп'ютерних системах.

Ось, наприклад, результат роботи Perchance.org з генерації тексту в зображення за запитом «красива жінка»:

Зображення ШІ, згенеровані на Perchance.org 13 серпня 2024 року. Зображення надані Tactical Tech.

Якщо інструмент створив шість зображень “красивих жінок”, чому вони всі виглядають майже однаково?

Спробуйте самостійно – чи будуть різнитися ваші результати?

На цю тему було проведено й інші дослідження , що показали схожі результати. З одним із таких досліджень ви можете ознайомитися за посиланням та переглянути відповідну інфографіку: «Люди упереджені. Генеративний ШІ – ще гірше».

Інструменти ШІ не є об'єктивними чи нейтральними. Ними володіють і їх створюють люди з власними інтересами. Навіть ті засоби штучного інтелекту, в назві яких є слово «відкритий», не завжди можуть бути прозорими щодо того, яким чином вони працюють, і можуть бути запрограмовані з вбудованими упередженнями.

Щоб зрозуміти, як ШІ є складовою частиною великої системи, ви можете задати ключові питання про те, як створюються ШІ-моделі та як їх навчають:

  • Хто володіє компаніями, які створюють моделі ШІ?
  • Як ці компанії отримують прибуток?
  • Які системи влади створюють або підтримують компанії?
  • Хто отримує найбільшу вигоду від інструментів ШІ?
  • Хто піддається найвищому ризику заподіяння шкоди від цих систем ШІ?

Знайти відповіді на ці питання може бути складно або взагалі неможливо. І це уже багато про що говорить.

Оскільки технології створюються людьми та формуються даними (які також збираються та маркуються людьми), ми можемо вважати технологію дзеркалом проблем, що вже існують у суспільстві.Тож є всі підстави вважати, що інструменти на основі штучного інтелекту призводять до посилення дисбалансу сил, систематизують та увічнюють упередження, причому це відбувається швидше, ніж будь-коли раніше.

Як ви вже зрозуміли, недосконалі моделі мислення є абсолютно нормальним явищем, і вони притаманні кожному з нас тією чи іншою мірою. Почавши усвідомлювати ці факти сьогодні, ви зможете уникнути помилок завтра, а також навчитеся виявляти недоліки всередині систем, таких як ШІ.

Почати обговорення

Шановні автори, будь ласка увійти »

Правила

  • Усі коментарі перевіряються модератором. Не надсилайте свій коментар більше одного разу, інакше він може бути ідентифікований як спам.
  • Будь ласка, ставтесь з повагою до інших. Коментарі, які містять мову ненависті, непристойність та особисті образи, не будуть опубліковані.